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OM nucleic - nucleic search, using sw model 
Run on; 



Title: 

Perfect score: 
Sequence : 



May 14, 2004, 00:22:53 ; Search time 9711.65 Seconds 

(without alignments) 

12622.391 Million cell updates/sec 

US-09-931-157-1 
4105 

1 gaattcgcggccgcctcttg taaaagtttacagaaacctt 4105 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 27513289 seqs, 14931090276 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 
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em_estba:* 
em_esthum: * 
em_estin : * 
em_estmu : * 
em_estov: * 
em__es tpl : * 
em_estro: * 
em_htc: * 
gb_estl : * 
gb_est2:* 
gb_htc : * 
gb_est3 : * 
gb_est4 : * 
gb_est5 : * 
em_estf un : ^ 
em__estom: * 
em_gss_hum: * 
em_gss_inv: ^ 
em_gss__pln : * 
em_gss_vrt : ^ 
em_gss_fun: * 
em_gss_mam: * 
em_gss_mus : * 
em_gss_pro: * 
em_gss_rod: * 
em_gss_phg: * 
em_gss vrl:* 



28: gb_gssl:* 
29: gb_gss2:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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AY417816 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



AY417816 1284 bp DNA linear GSS 17-DEC-2003 

Homo sapiens EDNRA gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY417816 

AY417816. 1 GI: 39773776 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 1284) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas,?,, Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H,, White, T. J., Sninsky, J . J • , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human-chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Ferriera, S 



to 1284) 

Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. 
Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
, Wang,G., Zheng, X.H., White, T.J,, Sninsky, J. J. , 



Adams, M.D. and Car gill, M. 
Direct Submission 

Submitted (16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualif iers 

1. .1284 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
<1. .>1284 
/gene="EDNRA" 
/locus_tag="HCM6350" 



ORIGIN 



Query Match 27.5%; 
Best Local Similarity 87.9%; 
Matches 1129; Conservative 



Score 1127.8; DB 29; Length 1284; 
Pred. No. 6.2e-240; 
0; Mismatches 155; Indels 0; Gaps 



0; 



Qy 



Db 



485 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
1 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 60 



Qy 



Db 



545 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 604 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 120 



Qy 605 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATC7UVCCCACTAATTTGGTCCTACCC 18 0 

Qy 665 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 181 AGCAATGGCTCAATGCAC7yVCTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCA7\A 24 0 

Qy 725 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC7VACT 784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TACATT7\ACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 300 

Qy 7 85 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 844 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CTGCTCAGGATCATTTACCAGAAC7VAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 360 

Qy 84 5 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 904 

I I I I M M I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 361 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 420 

Qy 905 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 

M I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 480 

Qy 965 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1024 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 540 

Qy 1025 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 600 

Qy 1085 GTAACTGCCATTG7\AATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1144 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 660 

Qy 1145 GCGATTGGCTTCGTCATGGTACCCTTTG7\ATATAGGGGTGAACAGCATAAAACCTGTATG 1204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 72 0 

Qy 12 05 CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 1264 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CTCAATGCCACATCAAAATTCATGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 78 0 

Qy 1265 GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1324 

Db 781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 84 0 

Qy 1325 GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTG7\ACATCTTAAGCAG 1384 

Db 841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

Qy 1385 CGTCGAGAAGTGGC7VAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 1444 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 960 



Qy 1445 CCTCTTCACTTAAGCCGTATATTG7\AGAAAACTGTGTATAACGAAATGGACAAGAACCGA 1504 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I 

Db 961 CCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAGATGGACAAGAACCGA 1020 

Qy 1505 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1564 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I 
Db 1021 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 108 0 

Qy 1565 AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCJ\AG7\AATTTAAAAATTGTTTC 1624 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I 
Db 1081 AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTA7W\ATTGTTTC 114 0 

Qy 1625 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1684 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1200 

Qy 1685 AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 1744 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AACGGAACAAGCATCCAGTGG7\AG7U^CCACGATCAAAACAACCAC7yVCACAGACCGGAGC 1260 

Qy 1745 AGCCATAAGGACAGCATGAACTGA 17 68 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AGCCATAAGGACAGCATGAACTGA 12 84 
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KEYWORDS 
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AUTHORS 



TITLE 
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AY417817 128 
Pan troglodytes EDNRA gene, 
genomic survey sequence. 
AY417817 

AY417817. 1 GI: 39773777 
GSS. 

Pan troglodytes (chimpanzee 
Pan troglodytes 
Eukaryota; Metazoa; Chordat 
Mammalia; Eutheria; Primate 

1 (bases 1 to 1284) 
Clark,A.G., Glanowski, S . , N 
Todd, M. A. , Tanenbaum, D.M. , 
Ferriera,S., Wang,G., Zheng 
Adams, M.D. and Cargill,M. 
Inferring nonneutral evolut 
gene trios 

Science 302 (5652), 1960-19 
14671302 

2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Ferriera, S 



4 bp DNA linear GSS 17-DEC-2003 

VIRTUAL TRANSCRIPT, partial sequence. 



) 

a; Craniata; Vertebrata; Euteleostomi ; 
s; Catarrhini; Hominidae; Pan. 

ielson,R., Thomas,?., Kejariwal, A, , 
Civello, D. R. , Lu,F., Murphy, B., 
,X.H., White, T. J., Sninsky, J . J. , 

ion from human- chimp-mouse orthologous 

63 (2003) 



to 1284) 
Glanowski, S , , N 
Tanenbaum, D . M 
, Wang,G., Zheng 
Adams, M.D. and Cargill,M. 
Direct Submission 
Submitted ( 16-NOV-2003) Cel 
Rockville, MD 20850, USA 
This sequence was made by s 
them based on alignment. 

Location/Qualifier 



ielson,R., Thomas, P., Ke jariwal , A. , 
Civello, D. R. , Lu,F., Murphy, B., 
,X.H., White, T. J., Sninsky, J . J. , 



era Genomics, 45 West Gude Drive, 
equencing genomic exons and ordering 



source 1. .1284 

/organism="Pan troglodytes" 

/mo l_type=" genomic DNA" 

/db_xref="taxon: 9598" 
gene <1. .>1284 

/gene="EDNRA" 

/locus_tag-"HCM6350" 

ORIGIN 

Query Match 26.2%; Score 1074.6; DB 29; Length 1284; 

Best Local Similarity 83.9%; Pred. No. 4.3e-228; 

Matches 1077; Conservative 0; Mismatches 207; Indels 0; Gaps 0; 

Qy 4 85 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 54 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 60 

Qy 545 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 12 0 

Qy 605 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 121 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATC7VACCCACTAATTTGGTCCTACCC 18 0 

Qy 665 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTA7WVTTACTTCAGCTTTCAAA 72 4 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I M I I I I I I I I 

Db 181 AGCAATGGCTCAATGCAC7VACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 24 0 

Qy 725 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 784 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 300 

Qy 785 CTGCTCAGGATCATTTACCAG7\ACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 844 

I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 301 CTGCTCAGGATCATTTACCAGAACAi^ATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 360 

Qy 845 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 904 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGTCTTGCCCTTGGAGANNNNNNCTATGTGGTCATTGATCTCCCTANNNNNNNNNNNNNN 42 0 

Qy 905 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I 
Db 421 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 480 

Qy 965 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1024 

I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 540 

Qy 1025 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1084 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 600 

Qy 1085 GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I 
Db 601 GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCT.TCATCCTGGCCATTCCTGAA 660 



Qy 1145 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 12 04 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 72 0 

Qy 1205 CTCAATGCCACATCAAAATTCATGGAGTTCTACCTU^GATGTAAAGGACTGGTGGCTCTTC 1264 

I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 721 CTCAATGCCACATCAAAATTCATGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 780 

Qy 1265 GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1324 

Db 781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 84 0 

Qy 1325 GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 1384 

Db 841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

Qy 138 5 CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 14 44 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I 
Db 901 CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 960 

Qy 1445 CCTCTTCACTTAAGCCGTATATTGAAGA7\AACTGTGTATAACGAAATGGACAAGAACCGA 1504 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I II I I I I II I I II 

Db 961 CCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAATGAGATGGACAAGAACCGA 1020 

Qy 1505 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGC7\ACCATG 1564 

I I 11 II M I I I I I I I I I I II I I I II I I M I I I I II II I I I I M I I I I I I I I I I I I I I I II 
Db 1021 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1080 

Qy 1565 AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGC/^GAAATTTAAAAATTGTTTC 1624 

I I I I I I II I II I I I II I I I II I I II I I II I I II I M I I II I I I I I I I II I I II M I II II 
Db 1081 AATTCATGTATAT^CCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTC 114 0 

Qy 1625 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1684 

III II II I I I I I I I I II I I II I I I I I I I I I II 

Db 1141 CAGNNNNNNNNNNNNNNNNNNNNNTACCAGTCCAAAAGNNNNATGACCTCGGTCCCCNNN 1200 

Qy 1685 AACGGTVACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 17 44 

I I I I I I I II I I II I I I I II I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I II I I I I 

Db 1201 NNCGGAACAAGCATCCAGTGG7\AGAACCACGATCAAAACAACCACAACACAGACCGGAGC 12 60 

Qy 1745 AGCCATAAGGACAGCATGAACTGA 17 68 

I I I I I I I I I I I I II I I I I I I I I I I 
Db 1261 AGCCATAAGGACAGCATGAACTGA 1284 
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AK043210 3538 bp mRNA linear HTC 19-SEP-2003 

Mus musculus 7 days neonate cerebellum cDNA, RIKEN full-length 
enriched library, clone :A730071B21 product : SIMILAR TO ENDOTHELIN 
RECEPTOR TYPE A, full insert sequence. 
AK043210 

AK043210. 1 GI: 2633558 4 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
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Please visit our web site for further details. 
URL : http : / / genome . gsc . riken . go . jp/ 
URL: http : // fantom. gsc. riken. go. jp/ . 

Location/Qualif iers 

1. .3538 

/organism="Mus musculus " 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref="FANTOM_DB:A730071B21" 

/db_xref="MGI: 2408358" 

/db_xref="taxon: 10090" 

/clone="A730071B21" 

/ tissue_type="cerebellum" 

/clone_lib=="RIKEN full-length enriched mouse cDNA library" 
/ dev_stage="7 days neonate" 
310. .1593 

/note="unnamed protein product; SIMILAR TO ENDOTHELIN 

RECEPTOR TYPE A ( SPTR | Q91W2 , evidence: FASTY, 97.7%ID, 

72.1%length, match=924) 

putative" 

/ codon_start=l 

/protein_id="BAC31493. 1" 

/db_xref-"GI: 26335585" 

/translation="MSIFCLAAYFWLTMVGGVMADNPERYS7i^LSSHMEDFTPFPGTE 
INFLGTTHRPPNLALPSNGSMHGYCPQQTKITTAFKYINTVISCTIFIVGMVGNATLL 
RIIYQNKCMRNGPNALIASLALGDLIYWIDLPINVFKLLAGRWPFDHNDFGVFLCKL 
FPFLQKSSVGITVLNLCALSVDRYRAVASWSRVQGIGIPLITAIEIVSIWILSFILAI 
PEAIGFVMVPFEYKGELHRTCMLNATSKFMEFYQDVKDWWLFGFYFCMPLVCTAIFYT 
LMTCEMLNRRNGSLRIALSEHLKQRREVAKTVFCLWIFALCWFPLHLSRILKKTVYD 
EMDKNRCELLSFLLLMDYIGINLATMNSCINPIALYFVSKKFKNCFQSCLCCCCHQSK 
SLMTSVPMNGTSIQWKNQEQNNHNTERSSHKDSMN" 



ORIGIN 



Query Match 26.0%; Score 1069; DB 11; Length 3538; 

Best Local Similarity 73.9%; Pred. No. 7.8e-227; 

Matches 1501; Conservative 0; Mismatches 470; Indels 60; 



Gaps 



9; 



Qy 



Db 



14 0 CCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATCCATCCCACCCGGTCG 199 

II I I I I I I I I I I I I I I I I M I I I I I I I I II I II II I I 

5 CCTTCTAGTCTGGCAACTGTGTCTAGGAGGTGGGGAGCCTCTCTCTGATCCACCGGACCA 64 



Qy 

Db 

Qy 

Db 



200 



65 



260 



TCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAGTGCCCAGG7VAGTTTT 

I I I I II I I I I II I I I I I I I I I I I I II I I 

TCGCTGGAGCTTGCAGGCTGAGCAAGATCTCCC CCTAGAGAAGCCT 



CTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGAGCCCGGGACACCGGC 
I I I I I I I I I I II INI I I I I I I I I II I I I I I I I I 

111 GGCTGTCCGGGGAAGTT TCCCCGAGCTGAGACTGTGCTGCAGCCCTGGTCACCCGC 



259 



110 



319 



166 



Qy 32 0 CACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGCCCAGGCGCCGCGCGG 379 

I I I I I I I I I M I I I I I I III II I I I II I I I I II M I I II I 

Db 167 CACCCTGCGCGCCACCCTCGTTCTCCAGCTCAGGCTCCGGCTGGCCCGTGCGC G 22 0 

Qy 38 0 ACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAAAGTGAAGGTGT7W\A 439 

I I I I I I I I I I I I I II I I M I I I I I I I I II I I I I I I I I I 

Db 221 GACCTGGAGCTGTCTGCTTCCGAGGAGCTCTAAGGTGA7\AAAAAGAAAGGCGTGAGACCA 2 80 

Qy 44 0 GCAGCAC7\AGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAGATGGAAACCCTTTGC 4 99 

MINI I I I I I I I I II I I I I I I II II 

Db 281 ACATAAGAAG ACTTAAAATCCAGGTTAAGATGAGTATCTTTTGC 324 

Qy 500 CTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGTGATAATCCTGAGAGA 559 

II I I I I I M I I I I M I I I I I I I I I I I I II I I II I I I I II I I M M 

Db 32 5 CTTGCGGCATACTTTTGGCTGACCATGGTGGGAGGCGTAATGGCTGACAATCCGGAGAGA 384 

Qy 560 TACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTTCGTGGCACAGAGCTC 619 

I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I 
Db 38 5 TACAGCGCTAATCTAAGCAGCCACATGGT^AGACTTCACCCCTTTTCCGGGGACGGAGATC 444 

Qy 62 0 AGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCCAGCAATGGCTCAATG 67 9 

I III I I I I I I I I I INI MM I I II I II I I III II I M I I I M I I I I I I I 

Db 44 5 AACTTTCTGGGCACCACCCATCGACCCCCTT^TTTGGCCCTGCCTAGCT^ATGGCTCAATG 504 

Qy 68 0 CACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAATACATTAACACTGTG 739 

III I I I I II I I II I II I M I I I I II II II I I I M II I I I II I I II II I I I I I I I 

Db 505 CACGGCTATTGCCCACAGCAGACTATWVTCACGACAGCTTTCAAATATATTAACACTGTG 564 

Qy 74 0 ATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATT 7 99 

II I II II II I II I II I I II I I I I II II II I II I M II I I I II I II I I I I I II 

Db 565 ATATCCTGCACCATTTTCATCGTGGGAATGGTGGGGAACGCAACTCTACTACGAATCATT 624 

Qy 8 00 TACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGA 859 

II I II II I I I I II I M I I II I I II II II I Mill I I I M II I II I I I I II II I 

Db 625 TACCAAAACAAGTGTATGAGGAACGGCCCCAATGCGCTCATAGCCAGCCTGGCCCTTGGA 684 

Qy 8 60 GACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGC 919 

I I I II I II I II I II I II I I M I Mill Mill II I I I II II I MM M III 

Db 68 5 GACCTTATCTACGTGGTCATTGACCTCCCCATCT^CGTGTTTAAGCTCTTGGCAGGACGC 744 

Qy 92 0 TGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAG 97 9 

I I I II M I II I II I I II I I II I I I I I II II II M I I I II II M I II I Mill 
Db 745 TGGCCTTTCGACCACAATGATTTTGGAGTGTTTCTCTGCAAGCTGTTCCCCTTCCTGCAG 804 

Qy 98 0 7VAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGA 1039 

I I M I I M I I II I II II I II I I I II I I II II I II II I II I I I I I I I II I I I I I 

Db 805 AAGTCCTCCGTGGGCATCACCGTCTTGAACCTCTGTGCTCTCAGTGTGGACAGGTACAGA 864 

Qy 104 0 GCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAA 1099 

I I I II II M I I I M I II I I II I II I I I II I I I II III I II I I I I I I I I I 

Db 8 65 GCAGTGGCTTCCTGGAGCCGAGTTCAAGGAATCGGGATCCCCTTGATTACCGCCATTGAA 924 

Qy 1100 ATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTC 1159 

II II I I I I II II I II I II II I II III I I I I I I I II II II I II I I I I I I I I I 

Db 92 5 ATCGTCTCCATCTGGATTCTTTCCTTCATCTTGGCCATCCCGGAAGCAATCGGCTTCGTC 984 



Qy 1160 ATGGTACCCTTTGAATATAGGGGTGAACAGCATATyyVCCTGTATGCTCTy^TGCCACATCA 1219 



I I I I I I I I I I I I I I I I I III II I Mill Mill II II II I I Mill II 

Db 985 ATGGTACCCTTCGAATACAAGGGCGAGCTGCATAGGACCTGCATGCTCAACGCCACGTCC 104 4 

Qy 122 0 AAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGT 1279 

II I M I I I I II I I II I I I I I I II I I II II I I I I M II I I I I II I I II M I M II 

Db 1045 AAGTTCATGGAGTTTTACCAAGATGTGAAGGACTGGTGGCTCTTTGGGTTCTACTTCTGC 1104 

Qy 1280 ATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGA 1339 

M I II II I I I I M I I II II II I II I I II II I M I M II I II I II II II I I I I II 

Db 1105 ATGCCCTTGGTGTGCACAGCT^TCTTCTACACCCTCATGACCTGTGAGATGCTCTVACAGG 1164 

Qy 1340 AGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCA 1399 

Mill II I I I M I I I II II I I I I II II II II II I II II I I I I II II II I II 
Db 1165 AGGAACGGCAGCTTGCGGATCGCCCTTAGTGAGCACCTCAAACAGCGTCGAGAAGTGGCA 1224 

Qy 14 00 AAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGC 1459 

II II II I II II I II I I I I I I II II II II II I I I I I II I I I M I I I I I I I I II 
Db 122 5 AAGACTGTCTTCTGCTTGGTTGTCATCTTCGCCCTGTGCTGGTTCCCTCTTCACTTAAGC 12 84 

Qy 14 60 CGTATATTGAAG/^AAACTGTGTATAACGA/VATGGACAAGAACCGATGTGAATTACTTAGT 1519 

II II I II I II I I II I I I I III I M II II I I I I II II I MUM I II II 

Db 1285 CGCATTTTGAAGAAAACTGTATATGATGAGATGGATAAGAACCGGTGTGAACTGCTCAGC 1344 

Qy 1520 TTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAAC 157 9 

I I II I I II I I I I I I M I I I I I I II II I I M I I I I I M II I I M M I M II I I M 

Db 1345 TTCTTGCTGCTAATGGATTACATCGGCATTAACCTGGCAACCATGAATTCTTGCATAAAC 1404 

Qy 1580 CCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTCCAGTCATGCCTCTGC 1639 

II II I I II I I I II I I I M I M I II I II I I I I I II I I I I II I I II I I I I I II I M 

Db 14 05 CCAATAGCTCTATATTTTGTGAGCAAGAAATTCA7\7\AATTGTTTTCAGTCCTGCCTCTGT 14 64 

Qy 164 0 TGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG7\ACGGAACAAGCATC 1699 

II II I III I I II I I I I I I I I I II I II I II II II M II II I II I I II I I II III 
Db 14 65 TGCTGTTGTCACCAGTCCAAAAGCCTCATGACCTCGGTCCCCATGAATGGAACGAGTATC 1524 

Qy 1700 CAGTGGAAGAACCACGATCAAAACAACCAC7VACACAGACCGGAGCAGCCATAAGGACAGC 1759 

II II II I II I I II I II II I I I II I I II I I I II II II II II I I I I I II I II I M I 

Db 1525 CAGTGGAAGAACCAAGAGCAGAACAACCACAACACGG7VACGGAGCAGCCACAAGGACAGC 1584 

Qy 1760 ATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAAAA 1819 

I I I M I I I I I II II II I I I II II II I I I I I I I 

Db 1585 ATGAACTAACCCTCCGCAGAAACACCGAGACGTGTGCCTTCAAGTCCTAGGATGGAAACA 1644 

Qy 1820 ATCACAAGGCAACTGTGACTCCGGGAATCTCT TCTCTGATCCTTCTTCCTTA 1871 

III I II I I I II II II MM I I I I II I II 

Db 164 5 ACCATTACGCCACAGATGCGCTCCCAAAACCTCCCAAGTCTCTCCCATGCTCCTTTTCTA 17 04 

Qy 1872 ATTCACTCCCACACCCAAGAAG7\AATGCTTTCCAJ\AACCGCAAGGTAGACTGGTTTATCC 1931 

III I II I I I I II II I I I II I I I I I II I 

Db 1705 AGTCCATCCTAGGAAAAGCTCTCCTGCCCTCCCAACAGCACGTGGTGGACCGGT C 1759 

Qy 1932 ACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTT 1991 

I I III II I I I III I I I II I I I M I II I I I 

Db 1760 CCAGCTATAGCCAATGGGTCTTTCCTGAGTACTGTATATGATTTGCATACCGCGCATGTC 1819 

Qy 1992 GTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCA 2051 

I I II I I I I I I II I M II I I I I I I M I I I I I II I I 



Db 



182 0 ATTTCCAACACTTGAAAAT TAGAGCTGGGAGAAAGGAGA-TGATGGTTCAAAGAA 1873 



Qy 2052 GAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAGCTTTTAT 2111 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1874 GCCACCTAGCTGCCGCCTTTGCATGAACACAGAGTTTGCAAGTTCATGACCAGCTTCCGT 1933 

Qy 2112 GGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAG 2162 

I I I I M I I M I I I I I I I I I I I I I I I I I I I I I 

Db 1934 -GCAGTTCTATGGACCAGCTGGTGGGAACTGTCCATCCTAAGATTCTAGAG 1983 
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gene 



AY417818 1284 bp DNA linear GSS 17-DEC-2003 

Mus musculus EDNRA gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY417818 

AY417818. 1 GI:39773778 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 

1 (bases 1 to 1284) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas,?., Kej ariwal , A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams,M.D. and Cargill,M, 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1284) 

Clark, A. G., Glanowski , S . , Nielson,R., Thomas,?., Kej ariwal , A. , 
Todd, M. A., Tanenbaum, D.M, , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T.J,, Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/ Qualifiers 

1. .1284 

/organism="Mus musculus" 
/mo l_type=" genomic DNA" 
/db_xref-"taxon: 10090" 
<1. .M284 
/gene="EDNRA" 
/locus_tag="HCM6350" 



ORIGIN 



Query Match 21,0%; Score 862.2; DB 29; Length 1284; 

Best Local Similarity 75,0%; Pred. No. 8e-181; 

Matches 963; Conservative 0; Mismatches 321; Indels 0; Gaps 0; 



Qy 



485 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 



Ill I I I I I I I I I I I I M II I II I M II I I I I I I I I I II I II I 

Db 1 ATGAGTATCTTTTGCCTTGCGGCATACTTTTGGCTGACGATGGTGGGAGGCGTAATGGCT 60 

Qy 54 5 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 604 

II I I I II I II I I I I I II II I I I I I I I I I I I II I I I I II I II I I I II I I I 

Db 61 GACAATCCGGAGAGATACAGCGCTAATCTAAGCAGCCACATGGAAGACTTCACCCCTTTT 12 0 

Qy 605 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I I I Ml I I I I I II I I I I I I I I I I I I I II I I I I I II II I I I 

Db 121 CCGGGGACGGAGATCAACTTTCTGGGCACCACCCATCGACCCCCTAATTTGGCCCTGCCT 18 0 

Qy 665 AGCAATGGCTC7\ATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I II I I I I I 

Db 181 AGCAATGGCTCAATGCACGGCTATTGCCCACAGCAGACTAA7\ATCACGACAGCTTTCAAA 24 0 

Qy 725 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 7 84 

II I I II I I I I I II I I I I I I II II I I I I I I I I I I I II II I I I I I I I I I II I I II I I 

Db 241 TATATTAACACTGTGATATCCTGCACCATTTTCATCGTGGGAATGGTGGGGAACGCAACT 300 

Qy 785 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGJ\ATGGCCCCAACGCGCTGATAGCC 84 4 

II II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 301 CTACTACGAATCATTTACCAAAACAAGTGTATGAGGAACGGCCCCAATGCGCTCATAGCC 360 

Qy 845 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 904 

II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I Mill I I I I I II I II I I I 

Db 361 AGCCTGGCCCTTGGAGACCTTATCTACGTGGTCATTGACCTCCCCATCAACGTGTTTAAG 42 0 

Qy 905 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 

M II II II I I I I I I II II I II I I I I I I I I II I II M I I I I I II II II I I I 

Db 421 CTCTTGGCAGGACGCTGGCCTTTCGACCACAATGATTTTGGAGTGTTTCTCTGCAAGCTG 480 

Qy 965 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1024 

II II II I I II I I I II II I I II I I I I I I I I I I II II I M I I I I I I II II I III 

Db 481 TTCCCCTTCCTGCAGAAGTCCTCCGTGGGCATCACCGTCTTGAACCTCTGTGCTCTCAGT 54 0 

Qy 1025 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1084 

II I M I I I I I I II I II I I I II I II II I I I II II I II I II I I Mill II III 
Db 541 GTGGACAGGTACAGAGCAGTGGCTTCCTGGAGCCGAGTTCAAGGAATCGGGATCCCCTTG 600 

Qy 1085 GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1144 

I II I II I II II II I I M I I I II I I II II II I I I II III I I I II II II III 

Db 601 ATTACCGCCATTGAAATCGTCTCCATCTGGATTCTTTCCTTCATCTTGGCCATCCCGGAA 660 

Qy 1145 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 1204 

II II I I M I I I I I I I I II II I I I I II I I I I III II I I II I I II II I III 

Db 661 GCAATCGGCTTCGTCATGGTACCCTTCGAATACAAGGGCGAGCTGCATAGGACCTGCATG 72 0 

Qy 12 05 CTCAATGCCACATCAAi\ATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 1264 

I I I I I I I II I II II I I I I II I II 
Db 721 CTCAACGCCACGTCCAAGTTCATGGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 780 

Qy 1265 GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1324 

Db 781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 84 0 



Qy 



1325 GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 1384 



Db 



841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1385 CGTCGAGAAGTGGC7\AAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 1444 

I I I I I I I I I I I I I I I I I II II I I I II I I I I I I II I II M II II I I I I I I M I 

901 CGTCGAGAAGTGGCAAAGACTGTCTTCTGCTTGGTTGTCATCTTCGCCCTGTGCTGGTTC 960 

1445 CCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGA 1504 

I I I M I I I I I I I I I I II II I I II I M I II I I I I Ml I II I I I I I I I I II I M 

961 CCTCTTCACTTAAGCCGCATTTTGAAGAAAACTGTATATGATGAGATGGATAAGAACCGG 102 0 

1505 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1564 

I I I I I I I II II II I II I II I I I I I I I I I I I I I I M II I I II I I I I I II I I II 

1021 TGTGAACTGCTCAGCTTCTTGCTGCTAATGGATTACATCGGCATTAACCTGGCAACCATG 108 0 

1565 7UVTTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTC 1624 

I I II I II I I I I I I I I II I I II I I I I I II I I I I i I M II I I I M I I I I I II I I I I 

1081 AATTCTTGCATAAACCCAATAGCTCTATATTTTGTGAGCAAGAAATTCAAAAATTGTTTT 114 0 

1625 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1684 

Mill I I I I I I I I II I II III I I I II M II I II I M II I I I I II I I I I I I I I II 

1141 CAGTCCTGCCTCTGTTGCTGTTGTCACCAGTCCAAAAGCCTCATGACCTCGGTCCCCATG 1200 

1685 AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCAC7VACACAGACCGGAGC 174 4 

II II I I I II I I II I I I I I I I I I I I II II II II I I I II I I I I I II II I I II II 

1201 AATGGAACGAGTATCCAGTGGAAGAACCAAGAGCAGAACAACCACAACACGGAACGGAGC 1260 

1745 AGCCATAAGGACAGCATGAACTGA 1768 

II I I I I II I I I I I II I I I I I I I 
1261 AGCCACAAGGACAGCATGAACTAA 1284 
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AU118882 865 bp ruRNA linear EST Ol-AUG-2002 

AU118882 HEMBAl Homo sapiens cDNA clone HEMBA1004569 5', mRNA 
sequence . 
AU118882 

AU118882.1 GI: 10934117 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 865) 

Ota,T., Nishikawa, T . , Suzuki, Y., Ishii,S., Saito^K., Kawai,Y., 
Yamamoto,J., Wakamatsu, A. , Nakamura,Y., Nagai^T.^ Sugano,S. and 
Isogai, T . 

HRI human cDNA project 
Unpublished (2000) 
Contact: Takao Isogai 
Genomics Laboratory 
Helix Research Institute 

1532-3 Yana, Kisarazu, Chiba 292-0812, Japan 
Tel: 81-438-52-3975 
Fax: 81-438-52-3986 
Email: genomics@hri.co.jp 

HRI human cDNA project; 5'- & 3* -end one pass sequencing: Helix 



Research Institute; cDNA library construction: Department of 
Virology, Institute of Medical Science, University of Tokyo, and 
Helix Research Institute. 
FEATURES Location/Qualifiers 
source 1. .865 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="HEMBA1004 569" 

/tissue_type-"whole embryo, mainly head" 
/dev_stage="embryo, 10 weeks" 
/clone_lib="HEMBAl" 
/note-"Vector: pME18SFL3" 

ORIGIN 

Query Match 19.4%; Score 797.8; DB 9; Length 865; 

Best Local Similarity 98.0%; Pred. No. 1.7e-166; 

Matches 847; Conservative 0; Mismatches 12; Indels 5; Gaps 4; 

Qy 1479 TGTATAACGAAATGGACAAGAACCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATT 1538 

II I I I I I II I I II I I M I I I II I II I II I I I I M II I I I I II I M I I II I II I II I I M 
Db 1 TGNATAACGAAATGGACAAG7VACCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATT 60 

Qy 1539 ACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCCATAGCTCTGTATTTTG 1598 

II I I I I I I I I I I I I I I I II I I I I I I I I II I M I I I I I I I I I I I I I I I I I I II I I I II I I I 
Db 61 ACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCCATAGCTCTGTATTTTG 12 0 

Qy 1599 TGAGCAAGAAATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCA 1658 

I I I I I I I I I I II I I I I I M I I I I I I I II I I I II I I I I I I I I I I I I M I I I M I I I I I I I I 
Db 121 TGAGCAAG7\AATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCA 18 0 

Qy 1659 AAAGTCTGATGACCTCGGTCCCCATGAACGGAACAAGCATCCAGTGGAAGAACCACGATC 1718 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I M 
Db 181 AAAGTCTGATGACCTCGGTCCCCATGAACGGAACAAGCATCCAGTGGAAGAACCACGATC 24 0 

Qy 1719 AAAACAACCACAACACAGACCGGAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAG 17 78 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 241 AAAACAACCACAACACAGACCGGAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAG 300 

Qy 1779 AAGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGAC 1838 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AAGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGAG 360 

Qy 1839 TCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCACACCCAAG7\AGAAATG 18 98 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCACACCCAAGAAGATyVTG 42 0 

Qy 1899 CTTTCCAAAACCGCAA-GGTAGACTGGTTTATCCACCCAC7\ACATCTACGAATCGTACTT 1957 

I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I II I I I I II I I I I I I M I I I I I I I I I I I 

Db 421 CTTTCCAAAACCGCAAGGGTAGACTGGTTTATCCACCCACAACATCTACGAATCGTACTT 480 

Qy 1958 CTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCACT7VAAAAATGGTGGGA 2017 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 4 81 CTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGA 54 0 



Qy 2018 GCTGGGGGAGAATGAAGACTGTTAAATGAAACCAGT^GGATATTTACTACTTTTGCATGA 2077 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



541 GCTGGGGGAGAATGAAGACTGTTAAATGAAACCAG7U\GGATATTTACTACTTTTGCATGA 600 



Qy 2 07 8 AAATAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTTCTGGTGAATGTTC7\ATGGG 2137 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I 

Db 601 7VAATAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGG 660 

Qy 2138 AACTGGTCACCATGAAACTTTAGAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGA- 2196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 AACTGGTCACCATGAAACTTTAGAGATTAACGAC7UVGATTTTCTACTTTTTTTAAGTGAT 720 

Qy 2197 TTTTTTGTCCTTCAGCCAAACACAATATGGGCTCAGGTCACTTTTATTTGAAATGTCATT 2256 

I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I 

Db 721 TTTTTTGNCCTTCAGCCAAACACAATATGGGCTCAAGTCACTTTTATTTGAAATGNCATT 7 80 

Qy 2257 TGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATG — ATTATTTGAACTTATTTA- 2313 

I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I II I I I II I I I I II 

Db 781 TGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATGGATTATTTGGAACTTATTTAC 840 

Qy 2314 CACATAGTTTGAAAAAAAAAAGAC 2337 

I I I I I I II I II I II I M I III 
Db 841 CNCNTAGTTTGAAAAAAAAAGGAC 864 
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Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



AU119546 863 bp mRNA linear EST Ol-AUG-2002 

AU119546 HEMBAl Homo sapiens cDNA clone HEMBA1006071 5\ mRNA 
sequence . 
AU119546 

AU119546.1 GI:10934781 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 863) 

Ota,T., Nishikawa,T. , Suzuki, Y., Ishii^S., Saito,K., Kawai,Y., 
Yamamoto,J., Wakamatsu, A. , Nakamura,Y., Nagai,T., Sugano,S. and 
Isogai, T . 

HRI human cDNA project 
Unpublished (2000) 
Contact: Takao Isogai 
Genomics Laboratory 
Helix Research Institute 

1532-3 Yana^ Kisarazu, Chiba 292-0812, Japan 
Tel: 81-438-52-3975 
Fax: 81-438-52-3986 
Email: genomics@hri.co.jp 

HRI human cDNA project; 5'- & 3'-end one pass sequencing: Helix 
Research Institute; cDNA library construction: Department of 
Virology, Institute of Medical Science, University of Tokyo, and 
Helix Research Institute. 

Location/ Qualifiers 

1. .863 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db xref="taxon:9606" 



/clone="HEMBA1006071" 

/tissue type="whole embryo, mainly head" 
/dev_stage="embryo, 10 weeks" 
/clone__lib="HEMBAl" 
/note="Vector: pME18SFL3" 

ORIGIN 

Query Match 19.3%; Score 792.2; DB 9; Length 863; 

Best Local Similarity 97.8%; Pred. No. 3e-165; 

Matches 84 5; Conservative 0; Mismatches 14; Indels 5; Gaps 4; 

GAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 2104 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

G7\AACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 6 0 

CTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGAT 2164 

I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I M I M M M I 

CTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGTWVCTTTAGAGAT 12 0 

TAACGACAAGATTTTCTACTTTTTTTAAGTGA — TTTTTTGTCCTTCAGCCAAACACAAT 2222 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
TAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTTTGTCCTTCAGCCAAACACAAT 18 0 

ATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATA 22 82 

I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

ATGGGCTCAAGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATA 240 

ATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAA 2342 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG-AAAAAAA7\AGACAAAAA 2 99 

TAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTA7\AAC 24 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TAGTATTCAGGTGAGC7VATTAGATTAGTATTTTCCACGTCACTGTTTATTTTTTTAAAAC 359 

ACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTATiJVGCACAGTCTGATGACACATT 24 62 

I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

ACAAATTCTAAAGCTACAACTVAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATT 419 

TGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAAT 2522 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I i I I I I I I I I I I I I I I I I I I I I I I 
TGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAAT 47 9 

GGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTT 2582 

I I I I I M I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I M I I I M I I I I I I I I I I I 

GGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTT^AATTCAAAAGTAATGCTT 539 

CAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAA 2642 

I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
CAATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGAAA 598 

AATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTC 27 02 

I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I M I I I I I I I I M I I M I I I I I 

AATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTC 658 
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Db 
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9 9 ft 


UD 
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Q n n 
0 U U 


Qy 


H \j 0 


Db 


360 


Qy 


2463 


Db 


420 


Qy 


2523 


Db 


480 


Qy 


2583 


Db 


540 


Qy 


2643 


Db 


599 



Qy 



2703 AGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGAT 2762 
I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 



Db 659 AGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGATWU^GATCGAATTTTTCAGAT 718 

Qy 2763 GATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCA 2822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 719 GATTCAGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGNATATACATATCA 77 8 

Qy 2823 CCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGT-AAGTCTTTTTTGATCAT 2881 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I M II I I I I III 

Db 77 9 CCTCCTATTCTCTTAATTTTTCTTA7\AATGGTAACTGGCAGTAAAGCCTTTTTTGACCAT 838 

Qy 2882 TCCCTTTTCCATATAGGAAACATA 2905 

I I I I I I I I I I I I II II I I 
Db 839 TCCCTTTTCATTTAGGGAAACTTA 862 



RESULT 7 
AU120519 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 
JOURNAL 
COMMENT 



FEATURES 

source 



Crania ta; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



AU120519 869 bp mRNA linear EST Ol-AUG-2002 

AU120519 HEMBBl Homo sapiens cDNA clone HEMBB1000846 S\ mRNA 
sequence . 
AU120519 

AU12 0519. 1 GI: 10935754 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 869) 

Ota,T., Nishikawa,T. , Suzuki, Y., Ishii.S., Saito^K., Kawai,Y., 
Yamamoto^J., Wakamatsu^A. , Nakamura,Y., Nagai,T., Sugano,S. and 
Isogai^T. 

HRI human cDNA project 
Unpublished (2000) 
Contact: Takao Isogai 
Genomics Laboratory 
Helix Research Institute 

1532-3 Yana, Kisarazu, Chiba 292-0812, Japan 
Tel: 81-438-52-3975 
Fax: 81-438-52-3986 
Email: genomics @hri . co , jp 

HRI human cDNA project; 5*- & 3 * -end one pass sequencing: Helix 
Research Institute; cDNA library construction: Department of 
Virology, Institute of Medical Science, University of Tokyo, and 
Helix Research Institute. 

Location/ Qualifiers 

1. .869 

/organism-"Homo sapiens" 
/mol_type-"mRNA" 
/db_xref-"taxon: 9606" 
/ clone= " HEMBB 1 00084 6" 

/tissue type=="whole embryo, mainly body" 
/dev_stage="embryo, 10 weeks" 
/clone_lib="HEMBBl" 
/note-"Vector : pME18SFL3" 



ORIGIN 



Query Match 



19.2%; Score 789; DB 9; Length 869; 



Best Local Similarity 98.0%; Pred. No. 1.5e-164; 

Matches 850; Conservative 0; Mismatches 12; Indels 5; Gaps 5; 



Qy 1771 ACCCTTAGAAGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAAA7\ATCACAAGGCA 1830 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I 
Db 1 ACCCTTAGAAGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAAAAATCACAAGGCA 60 

Qy 1831 ACTGTGACTCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCACACCCAAG 189 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 61 ACTGTGAGTCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCACACCCAAG 120 

Qy 1891 AAGAAATGCTTTCCAAAACCGC7UV-GGTAGACTGGTTTATCCACCCACAACATCTACG7y\ 1949 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 121 AAGA7\ATGCTTTCC7yW^.CCGCAAGGGTAGACTGGTTTATCCACCCACAACATCTACGAA 18 0 

Qy 1950 TCGTACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCACTAAAAAA 2009 

I I I I M I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 TCGTACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCACTAATW^A 240 

Qy 2010 TGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCAGAAGGATATTTACTACTT 2069 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 241 TGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCAGAAGGATATTTACTACTT 300 

Qy 2 070 TTGCATGAAAATAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTTCTGGTGAATGT 212 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 301 TTGCATGAAT^TAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTTCTGGTGAATGT 360 

Qy 2130 TCAATGGGAACTGGTCACCATG7VAACTTTAGAGATTAACGACAAGATTTTCTACTTTTTT 218 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M M I I I I I I I 

Db 361 TCAATGGGAACTGGTCACCATGAAACTTTAGAGATTAACGACAAGATTTTCTACTTTTTT 420 

Qy 2190 TAAGTGA-TTTTTTGTCCTTCAGCCAAACACAATATGGGCTCAGGTCACTTTTATTTGAA 22 4 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I 
Db 421 TAAGTGATTTTTTTGTCCTTCAGCCAAACACAATATGGGCTCAAGTCACTTTTATTTGAA 4 80 

Qy 224 9 ATGTCATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATGATTATTTGAACTT 2308 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I 
Db 481 ATGTCATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATGATTATTTGAACTT 540 

Qy 2309 ATTTACACATAGTTTGA7W\AAAAAAGACAAAAATAGTATTCAGGTGAGCAATTAGATTA 2368 

I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 ATTTACACATAGTTTGAAAAAAAAAAGACAAAAATAGTATTCAGGTGAGCAATTAGATTA 600 

Qy 2369 GTATTTTCCACGTCACTATTTATTTTTTTAAAACACAAATTCTAAAGCTACAACAAATAC 2428 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 GTATTTTCCACGTCACTGGTTATTTTTTTAAAACACANATTCTAAAGCTACAACAAATAC 660 

Qy 2429 TACAGGCCCTTAAAGCACAGTCTGATGACACATTTGGCAGTTTAATAGATGTTACTCAAA 24 88 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 TACAGGCCCTTAAAGCACAGTCTGATGACACATTTGGCAGTTTAATAGATGTTACTCAAA 720 

Qy 2489 GAATTTTTTAAGAACTGTATTTTATTTTTTAAATGGTGTTTTATTACAAGGGACCTTGAA 254 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I 
Db 721 GAATTTTTTAAGAACTGNATTTTATTTTTTGAATGGTGTTTTATTACAAGGGACCTTG-A 779 

Qy 2549 CATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCAATCAGATAGTTCTTTTTCACAAGT 2608 

I I I I I I I I I III I I I I II I I I I I I I M I I I II II I I M I II II II II I II I I II M 



Db 780 CATGTTTTGGATGGTAAATTCAAAAGTAATGCTTTAATCAGATAGTTC-TTTTCACAAGT 838 



Qy 2609 TC7\ATACTGTTTTTCATGTAAATTTTG 2635 

Mill III I II I I I I I I I I II I I I 

Db 839 TCAAT-CTGGTTTTCATGTAAATTTGG 8 64 



RESULT 8 
BX109539 

LOCUS BX109539 783 bp mRNA linear EST 07-FEB-2003 

DEFINITION BX109539 Soares_pregnant_uterus_NbHPU Homo sapiens cDNA clone 

IMAGp998G221159 ; IMAGE : 4 8734 1 , rtiRNA sequence. 
ACCESSION BX109539 

VERSION BX109539.1 GI: 27877774 

KEYWORDS EST . 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 783) 

AUTHORS Ebert,L., Heil,0., Hennig,S., Neubert,P., Partsch.E., Peters, M., 

Radelof,U., Schneider, D. and Korn,B. 
TITLE Human UnigeneSet - RZPD3 

JOURNAL Unpublished (2003) 
COMMENT Contact: Ina Rolfs 

RZPD Deutsches Ressourcenzentrum fuer Genomf orschung GmbH 
Im Neuenheimer Feld 580, D-69120 Heidelberg, Germany 
RZPD; IMAGp998G221159. 

RZPDLIB; I.M.A.G.E. cDNA Clone Collection; 
Human UnigeneSet - RZPD3 (RZPDLIB No. 972) 
http: //www. rzpd.de/CloneCards/cgi- 

bin/showLib.pl.cgi/response?libNo=972 Contact: Ina Rolfs 
RZPD Deutsches Ressourcenzentrum fuer Genomf orschung GmbH 
Heubnerweg 6, D-14059 Berlin, Germany 
Tel: +49 30 32639 101 
Fax: +49 30 32639 111 
www. rzpd. de 

This clone is available royalty-free from RZPD; 

contact RZPD (clone@rzpd.de) for further information. Seq primer: 
Ml3r, Primer sequence: TTTCACACAGGAAACAGCTATGAC . 
FEATURES Location/Qualifiers 
source 1. ,783 

/organism- "Homo sapiens" 
/mol_t ype= "mRNA" 
/db_xref="taxon: 9606" 

/clone="IMAGp998G221159 ; IMAGE : 487341" 

/sex="f emale" 

/dev_stage="adult" 

/lab_host="DH10B" 

/clone_lib="Soares_pregnant_uterus_NbHPU" 
/note="0rgan: uterus; Vector: pT7T3-Pac; Site_l: Not I; 
Site 2: Eco RI; 1st strand cDNA was primed with a Not I - 
oligo(dT) primer [5* 

AACTGGAAGAATTCGCGGCCGCCTTTTTTTTTTTTTTTTTT 3 ' ] , 
double-stranded cDNA was ligated to Eco RI adaptors 
(Pharmacia), digested with Not I and cloned into the Not I 
and Eco RI sites of the modified pT7T3 vector. Library 



went through one round of normalization. Library 
constructed by M. Fatima Bonaldo." 



ORIGIN 



Query Match 18.3%; Score 752.2; DB 13; Length 783; 

Best Local Similarity 98.9%; Pred. No. 2.4e-156; 

Matches 777; Conservative 0; Mismatches 6; Indels 3; Gaps 2; 

AAACATAATTTTGTUVGTGGCCAGATGAGTTTATCATGTCAGTGAAAAATTVATTACCCACA 2958 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I 

TWVCATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAAATUVTTVATTACCCACA 60 

AATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAGTATGAACCTAACTC 3018 

M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

AATGCCACCAG — AACTTACGATTCTTCACTTCTTGGGGTTTTCAGTATGAACCTAACTC 118 

CCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCCCACAGTGACTTTTG 3078 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCCCACAGTGACTTTTG 17 8 

CTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAAATCTTTTACTAGTGT 3138 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

CTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG7W\ATCTTTTACTAGTGT 23 8 

GTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTTTTCTAGACTGTCTC 3198 

I I I I I I I I I I I I I I M M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

GTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTTTTCTAGACTGTCTC 29 8 

TGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTATGTATGGATTTAAT 3258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I M M I I I I I I I I I I I 

TGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTATGTATGGATTTAAT 35 8 

CTAATCTAATAATTGTGCCCCGCAGTTGTGCCTW^GTGCATAGTCTGAGCTAAAATCTAG 3318 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

CTTy^TCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCTGAG-TAAAATCTAG 417 

GTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTAGCAACCTTCTGCAT 3378 

I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

GTGATTGTTCATCATGAC7UVCCTGCCTCAGTCCATTTTAACCTGTAGCAACCTTCTGCAT 477 

TCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAGGCAGCGTGAAAGCA 34 38 

I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I 

TCATA7yVTCTTGTAATCATGTTACCATTACAAATGGGATATAAGAGGCAGCGTG7\AAGCA 537 

GATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGTTTGATAAAGCAGTA 34 98 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I 

GATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGTTTGATAAAGCAGTA 597 

TTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACTTTGAAGTATTATAT 3558 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

TTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACTTTGAAGTATTATAT 657 

TGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCA 3618 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGTTCTTATCCTCAATTCAATGTGGTGATG7U\ATTGCCAGGTTGTCTGATATTTCTTTCA 717 



Qy 


2899 


Db 


1 


Qy 


2959 


Db 


61 


Qy 


3019 


Db 


119 


Qy 


3079 


Db 


179 


Qy 


3139 


Db 


239 


Qy 


3199 


Db 


299 


Qy 


3259 


Db 


359 


Qy 


3319 


Db 


418 


Qy 


3379 


Db 


478 


Qy 


3439 


Db 


538 


Qy 


3499 


Db 


598 


Qy 


3559 


Db 


658 



Qy 



3619 GACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATTTGTTGGGCCATATTT 3678 



I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 718 GACTTCGCCAGACAGATTGCTGATAATAAATTANGTAAGATAATTTGNTGGGCCATATTT 777 

Qy 3679 TAGGAC 3684 

II III 

Db 778 TANGAC 783 



RESULT 9 
AK042211 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 



Craniata; Vertebrata; Euteleostomi; 
Sciurognathi ; Muridae; Murinae; Mus . 



AK042211 3150 bp mRNA linear HTC 19-SEP-2003 

Mus musculus 3 days neonate thymus cDNA, RIKEN full-length enriched 
library, clone :A630071G03 product : SIMILAR TO ENDOTHELIN RECEPTOR 
TYPE A, full insert sequence. 
AK042211 

AK042211.1 GI: 26088888 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 

Carninci,P. and Hayashizaki, Y, 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki,Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata, K. , Itoh,M. , 
Konno,H., Akiyama,J. 

Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T. 
Yamamoto,R., Matsumoto, H . , Sakaguchi , S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki,Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FTU^TOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 



7Vizawa,K., Nagaoka,S., Sasaki, N., 
, Nishi,K., Kitsunai,T., Tashiro,H 



Carninci, P . , 
, , Itoh,M., 
Harada, A. , 



JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



misc feature 



of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3150) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P. 
Fukuda,S., Furuno,M. , Hanagaki,T., Kara, A. , Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto, K . , Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., lshii,Y., Itoh,M., Kagawa,!., Kasukawa,T,, 
Katoh,H., Kawai,J., Kojima,Y., Kendo, S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C., Matsuyama, T . , Miyazaki,A. , Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki, R. , Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C., Sakai,K., Sakazume, N . , 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A. , Takahashi, F- , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Toniaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y . 
Direct Submission 

Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama 
Kanagawa 230-0045, Japan (E-mail:genome-res@gsc. riken.go.jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222 , 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Tissues were provided by Dr. John Todd (Dept. of Medical Genetics 

Wellcome Trust Centre for Molecular Mechanisms in Disease Wellcome 

Trust/MRC building Addenbrookes Hospital Cambridge) whose 

assistance we gratefully acknowledge. 

Please visit our web site for further details. 

URLrhttp: //genome . gsc . riken. go. jp/ 

URLihttp: //f antom. gsc. riken. go. jp/ . 

Location/Qualifiers 

1. .3150 

/organism="Mus mus cuius" 
/mol_type="mRNA" 
/strain="C57BL/6J" 
/db_xref-"FANTOM_DB:A630071G03" 
/ db_xr e f = "MGI :2407243" 
/db_xref="taxon: 10090" 
/clone="A630071G03" 
/ tissue_type=" thymus" 

/clone_lib="RIKEN full-length enriched mouse cDNA library 
/dev_stage="3 days neonate" 
1. .3150 

/note="SIMILAR TO ENDOTHELIN RECEPTOR TYPE A (SPTRIQ91W2 
evidence: FASTY, 97.7%ID, 72.1%length, match=924)" 



ORIGIN 



Query Match 18.3%; Score 750.6; DB 11; Length 3150; 

Best Local Similarity 75.5%; Pred. No. 5.7e-156; 

Matches 1029; Conservative 0; Mismatches 289; Indels 45; 



Gaps 



Qy 



2 2 GGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGACGGGGAGGACAGACTGGA 8 1 



Db 


9 






Db 


67 


yy 


J. 1 /I. 


UJJ 


12 4 


Qy 


9 09 




184 


Qy 






9'^n 

^ o u 


Qy 


^59 9 




286 


Qy 


ft 9 
o 0 Z 


UiJ 


O 1 VJ 


Qy 


^ il 9 
't ft Z 




4 00 
1 u u 


Qy 


O UZ 




4 4 4 

T T 1 


Qy 


R (^9 
D DZ 


Db 


504 


Qy 


DZ Z 


Db 


564 


Qy 


D O Z 


UiJ 


624 


yy 


742 


Db 


684 


Qy 


802 


Db 


744 


Qy 


862 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II I 

GGTCCCAGAGTAGAGAGGAAGGTCTAGGAGCCTGTGGAGTCTAAGG7\AGATC — GCGGGA 66 

GGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCGCGCGCGTACAGTCATCC 141 

I I II I I I M I I I I I I I II II I I I I I I I I I I II I I I I II I II II 

GGCGTGTTCCTCCGGAGTTTGCTTTTCCTTGGGAGCCTCGCCGCGCACACCCA TCCC 123 

CGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATCCATCCCACCCGGTCGTC 201 

I I M I I I I I I I II I I I I I I II I I I I I II I I I I I I III 

TTCTAGTCTGGCAACTGTGTCTAGGAGGTGGGGAGCCTCTCTCTGATCCACCGGACCATC 183 



I I II I I I I II I I I I I I I II I I I I I I I 

GCTGGAGCTTGCAGGCTGAGCAAGATCTCCC CCTAGAGAAGCCTGG 22 9 

GAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGAGCCCGGGACACCGGCCA 321 

I I I I II I I I I II I I I I I I I I I I I II I I I I I I I II I I 

CTGTCCGGGGT^GTT TCCCCGAGCTGAGACTGTGCTGCAGCCCTGGTCACCCGCCA 285 

CCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGCCCAGGCGCCGCGCGGAC 381 

I I I I II I I I II I I I I III I I I I I I I I M I I I I I I I I I I 

CCCTGCGCGCCACCCTCGTTCTCCAGCTCAGGCTCCGGCTGGCCCGTGCGC GGA 339 

CCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAAAGTGAAGGTGTAAAAGC 441 

I I I I I I I II I I I I II I I I I I I I II I I I I M I I I I I I I II 

CCTGGAGCTGTCTGCTTCCGAGGAGCTCTAAGGTGAAAAAAAGAAAGGCGTGAGACCAAC 399 



I I I I I I I I I I I I I I I I I I I I II I I II I 



CAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGTGATAATCCTGAGAGATA 561 

I I I I I I I I II I I II I I I I I I III I I I I I I III I I I I I I I I I I I I I 

TGCGGCATACTTTTGGCTGACCATGGTGGGAGGCGTAATGGCTGACAATCCGGAGAGATA 503 

CAGCACATVATCTAAGCAATCATGTGGATGATTTCACCACTTTTCGTGGCACAGAGCTCAG 62 1 

I I II I I I I I I I II II II I I II I I I I I I I I I I I I I I I I I I I I I I I I 

CAGCGCTAATCTAAGCAGCCACATGGAAGACTTCACCCCTTTTCCGGGGACGGAGATCAA 563 

CTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCCAGCAATGGCTCAATGCA 681 

III I I I I I I I I I I I I I I I I I I II I I I I I I III II I I I I I II I II I I I I I I I 

CTTTCTGGGCACCACCCATCGACCCCCTAATTTGGCCCTGCCTAGCAATGGCTCT^TGCA 623 

CAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAATACATTAACACTGTGAT 741 

I M I I I I I I I I I I I I I I I I I I I M I II I I I I I I I II I I I I I I I M I I I I I I I I I 

CGGCTATTGCCCACAGCAGACTAi^AATCACGACAGCTTTCAAATATATTAACACTGTGAT 683 

ATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTA 801 

III II II I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I 

ATCCTGCACCATTTTCATCGTGGGAATGGTGGGGAACGCAACTCTACTACGAATCATTTA 743 

CCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGA 861 

III Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

CCAAAACAAGTGTATGAGGAACGGCCCCAATGCGCTCATAGCCAGCCTGGCCCTTGGAGA 803 

CCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTG 921 
I I II M M I I I I I I Ill II I I I I I I I I I I I I II INN 



Db 



804 CCTTATCTACGTGGTCATTGACCTCCCCATC7\ACGTGTTTAAGCTCTTGGCAGGACGCTG 863 



Qy 


922 


Db 


864 


Qy 


982 


Db 


924 


Qy 


1042 


Db 


984 


Qy 


1102 


Db 


1044 


Qy 


1162 


Db 


1104 


Qy 


1222 


Db 


1164 


Qy 


1282 


Db 


1224 


Qy 


1342 


Db 


1284 



GCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCTUVGCTGTTCCCCTTTTTGCAGAA 981 

I I I I I I II I I I I I I M I I II I II Mill I I II I I I M II I I I I I I I I I I I II 

GCCTTTCGACCACAATGATTTTGGAGTGTTTCTCTGCAAGCTGTTCCCCTTCCTGCAGAA 92 3 

GTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGC 1041 

II I I I I II I I I I II II I I II I I II I I I II I II II I I I II I I I I I II I I I M II 

GTCCTCCGTGGGCATCACCGTCTTGAACCTCTGTGCTCTCAGTGTGGACAGGTACAGAGC 983 

AGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGT7VACTGCCATTGAAAT 1101 

Ml M M I I I I I I M II II I Mill II I II II III I II I I M II II II I 

AGTGGCTTCCTGGAGCCGAGTTCAAGGAATCGGGATCCCCTTGATTACCGCCATTGA7UVT 104 3 

TGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCAT 1161 

II I I I M II II I II II II I II III II I II II II II I I I II M II I I I I I II 

CGTCTCCATCTGGATTCTTTCCTTCATCTTGGCCATCCCGGAAGCAATCGGCTTCGTCAT 1103 

GGTACCCTTTG7\ATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCCACATCAAA 1221 

II II I I II I I II I I I III II I Mill I II II I II I II I I I II II M II 

GGTACCCTTCGAATACAAGGGCGAGCTGCATAGGACCTGCATGCTCAACGCCACGTCCAA 1163 

ATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTAT 1281 

I I I I I I II I II I I II I I I II M M I II II II I I II II I I II I I I II I Mill II 
GTTCATGGAGTTTTACCAAGATGTGAAGGACTGGTGGCTCTTTGGGTTCTACTTCTGCAT 1223 

GCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAG 1341 

I II I II I II I II I II II II II I II II I I II I I M II I I II I II II I I II II I II 

GCCCTTGGTGTGCACAGCAATCTTCTACACCCTCATGACCTGTGAGATGCTCAACAGGAG 1283 

GAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 1384 

III I II I II I I I I II I I I II I I I II II II II III 

GAACGGCAGCTTGCGGATCGCCCTTAGTGAGCACCTCAAACAG 132 6 



RESULT 10 

AI936539/C 

LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

0RG7\NISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



AI936539 781 bp mRNA linear EST 17-DEC-1999 

wd29b09.xl Soares_NFL_T_GBC__Sl Homo sapiens cDNA clone 
IMAGE: 2329529 3» similar to gb:S57498 ENDOTHELIN-1 RECEPTOR 
PRECURSOR (HUMAN);, mRNA sequence. 
AI936539 

AI936539.1 GI:5675409 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 781) 

NCI-CGAP http : //www. ncbi . nlm. nih . gov/ncicgap . 

National Cancer Institute, Cancer Genome Anatomy Project (CGAP) , 

Tumor Gene Index 

Unpublished (1997) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail .nih. gov 

This clone is available royalty-free through LLNL ; contact the 
IMAGE Consortium (info@image.llnl.gov) for further information. 



FEATURES 

source 



Insert Length: 1132 Std Error: 0.00 
Seq primer: -40UP from Gibco 
High quality sequence stop: 456. 

Location/ Qualifiers 

1. .781 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 2329529" 
/lab_host="DH10B" 

/clone_lib-"Soares_NFL_T_GBC_Sl" 

/note="Organ: pooled; Vector: pT7T3D-Pac (Pharmacia) with 
a modified polylinker; Site_l : Not I; Site_2 : Eco RI; 
Equal amounts of plasmid DNA from three normalized 
libraries (fetal lung NbHL19W, testis NHT, and B-cell 
NCI_CGAP_GCB1) were mixed, and ss circles were made in 
vitro. Following HAP purification, this DNA was used as 
tracer in a subtractive hybridization reaction. The driver 
was PCR-amplif ied cDNAs from pools of 5,000 clones made 
from the same 3 libraries. The pools consisted of 
I.M.A.G.E. clones 297480-302087, 682632-687239, 
726408-728711, and 729096-731399. Subtraction by Bento 
Soares and M. Fatima Bonaldo. 



ORIGIN 



Query Match 17.7%; 
Best Local Similarity 97.1%; 
Matches 748; Conservative 



Score 725,6; DB 9; 
Pred. No. 2e-150; 
0; Mismatches 21; 



Length 781; 
Indels 1; 



Gaps 



1; 



Qy 



Db 



3336 CAACCTGCCTCAGTCCATTTTAACCTGTAGCAACCTTCTGCATTCATTVAATCTTGTAATC 3395 

III I II I I I I I II M I I I I II I II II I I I I I I II II M I I I I I I I II I II I II 

773 CAAACAGCTTCAGTCCATTTT-ACCTGTAGCAACCGTCTGCATTCATAATTCTTGTAGTC 715 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



3396 ATGTTACCATTACAAATGGGATATAAGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAG 3455 

I I I I I I I I I I I II I I I I I I II I I I M I I I I I I I II I I II I I II I I I i I I II 

714 ATGTACCCATTACNAATGGGATATT^GAGCAAGCGTGAAAGCAGATGAGCTGTGACTTUVG 655 

34 56 CAATATAGGGTTTTGTTTGGTTGGTTGGTTTGATAAAGCAGTATTTGGGGTCATATTGTT 3515 

I I I I I II I II I II M I I I I I I I I I I I I I I I II II I I I I I M I I I I I I I I I I I I I I I M 

654 CAATATAGGGTTTGGTTTGGTTGGTTGGTTTGATANAGCAGTATTTGGGGTCATATTGTT 595 

3516 TCCTGTGCTGGAGCAAAAGTCATTACACTTTGAAGTATTATATTGTTCTTATCCTCAATT 3575 

II I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I II I I I II I II I I I I I I I I 

594 TCCTGTGCTGGAGCAAAAGTCATTACACTTTGGAGTATTATATTGTTCTTATCCTCAATT 535 

3576 CAATGTGGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACAGAT 3635 
I I I I M I I I I I II I I I I I M I I I I I I I I II I I I I I I I I I I II I I I I I II I I M I I I I I I I 
534 CAATGTGGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACAGAT 475 

3636 TGCTGATAATAAATTAGGTAAGAT7VATTTGTTGGGCCATATTTTAGGACAGGTAAAATAA 3695 
I II I I I I I I I I I I I M I I I M I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I 
4 74 TGCTGATAATAAATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTAAAAT7\A 415 



Qy 

Db 



3696 CATCAGGTTCCAGTTGCTTGAATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGC 3755 
I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I 
414 CATCAGGTTCCAGTTGCTTGTVATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGC 355 



Qy 3756 AGTCAAATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTATAATATAAGC 3815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 354 AGTCAAATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTATAATATAAGC 2 95 

Qy 3816 CATAGGTTCACACCATTTTGTTTAGACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTT 3875 

I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 294 CATAGGTTCACACCATTTTGTTTAGACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTT 235 

Qy 3876 CATATGAAA7\AAATGCATTTTATAAATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACG 3935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 234 CATATGAAAAAAATGCATTTTATAAATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACG 175 

Qy 3936 TGCATTTTATTTATGGACTGGTAAGTAACTGTGGTTTACTAGCAGGAATATTTCCAATTT 3995 

I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 174 TGCATTTTATTTATGGACTGGTAAGTAACTGTGGTTTACTAGCAGGAATATTTCCAATTT 115 

Qy 3996 CTACCTTTACTACATCTTTTCAACAAGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCC 4055 

I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I 

Db 114 CTACCTTTACTACATCTTTTCAACAAGT7NACTTTGTAGAAATGAGCCAGAAGCCAAGGCC 55 

Qy 4056 CTGAGTTGGCAGTGGCCCATAAGTGTAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I IN II I I I I 

Db 54 CTGAGTTGGCAGTGGCCCATAAGTGTAAAATAA7\AGTTAACAAAACCCTT 5 



RESULT 11 

BM719244 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
MEDLINE 
PUBMED 
COMMENT 



Craniata ; Vertebrata ; Euteleostomi ; 



BM719244 733 bp mRNA linear EST Ol-MAR-2002 

UI-E-EOl-ajd-b-04-O-UI.rl UI-E-EOl Homo sapiens cDNA clone 
UI-E-EOl-ajd-b-04-O-UI 5*, mRNA sequence. 
BM719244 

BM719244. 1 GI: 19037818 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 733) 

Bonaldo,M. F. , Lennon,G. and Soares.^M.B. 

Normalization and subtraction: two approaches to facilitate gene 
discovery 

Genome Res. 6 (9), 791-806 (1996) 

97044477 

8889548 

Contact: Soares, MB 

Coordinated Laboratory for Computational Genomics 
University of Iowa 

375 Newton Road , 4156 MEBRF, Iowa City, lA 52242, USA 

Tel: 319 335 8250 

Fax: 319 335 9565 

Email: bento-soares(3uiowa . edu 

Tissue Procurement: Dr. Gregg Hageman 
cDNA Library preparation: Dr. M. Bento Soares, Univeristy of Iowa 
cDNA Library Arrayed by: Dr. M. Bento Soares, Univeristy of Iowa 
DNA Sequencing by: Dr. M. Bento Soares, Univeristy of Iowa 
Clone Distribution: Researchers may obtain clones from Research 

Genetics (www.resgen.com). 



Seq primer: Ml3 Reverse. 
FEATURES Location/Qualifiers 
source 1. .733 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="UI-E-EOl-ajd-b-04-0-UI" 
/tissue_type="f etal eye" 
/dev_stage="fetal" 

/lab_host="DH10B (Life Technologies) (Tl phage resistant)" 
/clone_lib-"UI-E-EOl" 

/note="Organ: eye; Vector: pT7T3-Pac (Pharmacia) with a 
modified polylinker; Site_l: EcoR I; Site_2 : Not I; 
UI-E-EOl is a normalized cDNA library containing the 
following tissue(s): fetal eye. The library was 
constructed according to Bonaldo, Lennon and Soares, 
Genome Research, 6:791-806, 1996. First strand cDNA 
synthesis was primed with an oligo-dT primer containing a 
Not I site. Double stranded cDNA was ligated to an EcoR I 
adaptor, digested with Not I, and cloned directionally 
into pT7T3-Pac vector. The oligonucleotide used to prime 
the synthesis of first-strand cDNA contains a library tag 
sequence that is located between the Not I site and the 
(dT)18 tail. The sequence tag for this library is 
CGCGTATACC. This library was created for the program. Gene 
Discovery in the Visual System, supported by National Eye 
Institute (NEI) . " 

ORIGIN 



Query Match 17.3%; Score 710.4; DB 12; Length 733; 

Best Local Similarity 99.4%; Pred. No. 4.8e-147; 

Matches 722; Conservative 0; Mismatches 3; Indels 1; Gaps 1; 



Qy 


3162 


TGTA7\ATTTCTTTTAGCCCATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTG 


3221 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


1 


TGTAAATTTCTTTTAGCCCATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTG 


60 


Qy 


3222 


ATATATGCATGTGTGTGATGGTATGTATGGATTTAATCTAATCT7^T7\ATTGTGCCCCGC 


3281 






1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


ATATATGCATGTGTGTGATGGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGC 


120 


Qy 


3282 


AGTTGTGCCAT^AGTGCATAGTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCT 


3341 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


AGTTGTGCCAAAGTGCATAGTCTGAG-T7\AAATCTAGGTGATTGTTCATCATGACAACCT 


179 


Qy ■ 


3342 


GCCTCAGTCCATTTTAACCTGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTA 


3401 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


180 


GCCTCAGTCCATTTTAACCTGTAGCAACCTTCTGCATCCATAAATCTTGTAATCATGTTA 


239 


Qy 


3402 


CCATTACAAATGGGATATT^AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCi^ATAT 


3461 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


240 


CCATTACAAATGGGATATAAGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGC7\ATAT 


299 


Qy 


3462 


AGGGTTTTGTTTGGTTGGTTGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGT 


3521 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


300 


AGGGTTTTGTTTGGTTGGTTGGTTTGAT7WVGCAGTATTTGGGGTCATATTGTTTCCTGT 


359 



Qy 3522 GCTGGAGCAAAAGTCATTACACTTTG7\AGTATTATATTGTTCTTATCCTCAATTCAATGT 3581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GCTGGAGCAAAAGTCATTACACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGT 419 

Qy 3582 GGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGA 3641 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I 
Db 42 0 GGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGA 479 

Qy 3642 TAATAAATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAG 3701 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db' 480 TAAT7VAATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAG 539 

Qy 3702 GTTCCAGTTGCTTGAATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAA 3761 

I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 54 0 GTTCCAGTTGCTTGAATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCTy^ 599 

Qy 37 62 ATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTATAATATAAGCCATAGG 3821 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 600 ATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTATAATATAAGCCATAGG 659 

Qy 3822 TTCACACCATTTTGTTTAGACAATTGTCTTTTTTTC7\AGATGCTTTGTTTCTTTCATATG 3881 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 660 TTCACACCATTTTGTTTAGACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATG 719 

Qy 3882 AAAAAA 3887 

I I I I I 

Db 720 NAAAAA 725 



RESULT 12 

BQ018994/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



FEATURES 



BQ018994 777 bp mRNA linear EST 27-MAR-2002 

UI-H-DHl-awv-o-07-O-UI.sl NCI_CGAP_DH1 Homo sapiens cDNA clone 
IMAGE: 5824350 3*, mRNA sequence. 
BQ018994 

BQ018994 . 1 GI: 19754271 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 777) 

NCI-CGAP http: //www . ncbi . nlm. nih . gov/ncicgap . 

National Cancer Institute, Cancer Genome Anatomy Project (CGAP) , 

Tumor Gene Index 

Unpublished (1997) 

Contact: Robert Strausberg, Ph*D. 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Dr. Jose Mercuende 
cDNA Library preparation: Dr. M. Bento Soares, University of Iowa 
cDNA Library Arrayed by: Dr. M. Bento Soares, University of Iowa 
DNA Sequencing by: Dr. M. Bento Soares, University of Iowa 
Clone Distribution: Clone distribution information can be found 

through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 

Seq primer: M13 FORWARD 

POLYA=Yes . 

Location/Qualifiers 



source 



1. .777 

/organism-"Homo sapiens" 
/mol_type="mRNA" 
/db_xref-"taxon: 9606" 
/clone="IMAGE: 5824350" 

/tissue type="Metastatic Chondrosarcoma" 
/ de v_s t age= " Adul t " 

/lab_host="DH10B (Life Technologies)" 
/clone^lib- " NC I_CGAP_DH 1 " 

/note="Organ: Lung; Vector: pT7T3-Pac (Pharmacia) with a 
modified polylinker; Site_l: EcoR I; Site__2 : Not I; 
NCI CGAP DHl is a normalized cDNA library containing the 
following tissue (s): VS-8 Cell line from Metastatic 
Chondrosarcoma in Lung. The library was constructed 
according to Bonaldo, Lennon and Soares, Genome Research, 
6:791-806, 1996, First strand cDNA synthesis was primed 
with an oligo-dT primer containing a Not I site. Double 
stranded cDNA was ligated to an EcoR I adaptor, digested 
with Not I, and cloned directionally into pT7T3-Pac 
vector. The oligonucleotide used to prime the synthesis of 
first-strand cDNA contains a library tag sequence that is 
located between the Not I site and the (dT) 18 tail. The 
sequence tag for this library is AGATCATTGC. 
TAG_T I S SUE=lung 
TAG_LIB=UI-H-DH1 
TAG SEQ=AGATCATTGC" 



ORIGIN 



Query Match 17.2%; Score 704.2; DB 12; Length 777; 

Best Local Similarity 97.9%; Pred. No. l.le-145; 

Matches 734; Conservative 0; Mismatches 14; Indels 2; 



Gaps 



2; 



Qy 


1595 


Db 


750 


Qy 


1655 


Db 


690 


Qy 


1715 


Db 


630 


Qy 


1775 


Db 


570 


Qy 


1835 


Db 


510 


Qy 


1895 


Db 


450 



TTTGTGAGCAAG7WVTTTAAAAATTGTTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAG 1654 

I I II I I I II I I II I I I I I M M II I I I I I I I I I I I I I I I I I M II I I I I 

TATNTGTGAGCAAGAATTTAAAAATGTTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAG 691 

TCC7W\AGTCTGATGACCTCGGTCCCCATGAACGGAAC7WVGCATCCAGTGG7\AGAACCAC 1714 

I I I I I II I I I I I I I I I I M I I I I I M I I I I I I I I I I I I M I I M I M I I I I I I I I I I I I I 

TCCAAAAGTCTGATGACCTCGGTCCCCATGAACGGAACAAGCATCCAGTGGAAGAACCAC 631 
GATCAAAACAACCACAACACAGACCGGAGCAGCCATAAGGACAGCATGAACTGACCACCC 1774 

II I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I Ml II I M I I I I I 

GATCTWyVCAACCACAACACAGACCGGAGCAGCCATAAGGACAGCATGAACTGACCACCC 571 

TTAGAAGCACTCCTCGGTACTCCCAT7\ATCCTCTCGGAGA7V7WWVTCACAAGGCAACTG 18 34 

II I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I M M 
TTAG7\AGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAAAAATCACAAGGCAACTG 511 

TGACTCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCACACCCAAGAAGA 18 94 

III II II II II I I I I I I I I I II II I I I I I I I I I I I I M M I I II I I I I II I I I I 

TGAGTCCGGG7UVTCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCACACCCAAGAAGA 451 

AATGCTTTCCAAAACCGCAA-GGTAGACTGGTTTATCCACCCACAACATCTACGAATCGT 1953 

I II I I I I I I I I I I M I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AATGCTTTCCAAAACCGCAAGGGTAGACTGGTTTATCCACCCACAACATCTACGAATCGT 391 



Qy 



1954 ACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCACTA7UW\ATGGT 2013 



Db 


390 




2014 


Db 


330 




2074 


Db 


270 




2134 


Db 


210 


wy 


2194 


Db 


150 


Qy 


2253 


Db 


90 


Qy 


2313 


Db 


30 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

ACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCACTAAAAAATGGT 331 
GGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCAGAAGGATATTTACTACTTTTGC 2 07 3 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n I I I I I I I I I I I I I 

GGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCAGAAGGATATTTACTACTTTTGC 271 

ATGAAAATAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAA 2133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGAi\AATAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTTCTGGTG7yVTGTTCAA 211 

TGGGAACTGGTCACCATGAAACTTTAGAGATTAACGACAAGATTTTCTACTTTTTTT/lAG 2193 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGGAACTGGTCACCATGAAACTTTAGAGATT7\ACGACAAGATTTTCTACTTTTTTTAAG 151 

TGA-TTTTTTGTCCTTCAGCCAAACACAATATGGGCTCAGGTCACTTTTATTTGAAATGT 2252 

III I II I I I I II M I M II I II II II I II M M I I I M I I I I M I I I M I I M I I II I 

TGATTTTTTTGTCCTTCAGCCAAACACT^TATGGGCTCAAGTCACTTTTATTTGAAATGT 91 
CATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATGATTATTTGAACTTATTT 2312 

M I I I II I I I I I M I I I M I I II I I II I M I I I I I I I M I I I II I I I I I I I I I I I I I I M 

CATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATGATTATTTGAACTTATTT 31 
ACACATAGTTTGAjQAAAAAAAAGACTVAAAA 2342 

I I I I I I I I II I I M I I I I M M M I I I M 

ACACATAGTTTGAAAAAAAAAAAACAAAAA 1 



RESULT 13 

AU139639 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 
JOURNAL 
COMMENT 



AU139639 764 
AU139639 PLACEl Homo sapiens 
sequence . 
AU139639 

AU139639. 1 GI: 11001160 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; 
1 (bases 1 to 764) 
Ota,T., Nishikawa,T 



bp mRNA linear EST 05-AUG-2002 
cDNA clone PLACE101102 9 5*, mRNA 



Primates ; 



Craniata ; Vertebra ta ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



Suzuki, Y., Ishii^S., Saito,K., Kawai,Y., 



Yamamoto,J., Wakamatsu, A. , Nakamura,Y., Nagai,T., Sugano,S. and 
Isogai, T . 

HRI human cDNA project 
Unpublished (2000) 
Contact: Takao Isogai 
Genomics Laboratory 
Helix Research Institute 

1532-3 Yana, Kisarazu, Chiba 292-0812, Japan 
Tel: 81-438-52-3975 
Fax: 81-438-52-3986 
Email: genomics@hri.co.jp 

HRI human cDNA project; 5*- & 3* -end one pass sequencing: Helix 
Research Institute; cDNA library construction: Department of 
Virology, Institute of Medical Science, University of Tokyo, and 
Helix Research Institute. 



FEATURES Location/Quali f iers 

source 1. .764 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="PLACE101102 9" 
/tissue_type= "placenta" 
/clone_lib="PLACEl" 
/note="Vector: pME18SFL3" 

ORIGIN 

Query Match 17.0%; Score 695.8; DB 9; Length 7 64; 

Best Local Similarity 97.6%; Pred. No. 8.5e-144; 

Matches 72 6; Conservative 0; Mismatches 15; Indels 3; Gaps 2; 

Qy 2322 TTG7\AAAAAAAAAGACAAAAATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGT 2381 

II I I I I I I II I I I I I II II II I I II I I I I II I M I II I I I I I I I I I I II I II I I I I M 
Db 5 TTTGAA7VAAAAAAGACAAAAATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGT 64 

Qy 2382 CACTATTTATTTTTTTAAAACACAAATTCTAAAGCTACAAC7\AATACTACAGGCCCTTAA 2441 

I I I I I I I I I II I I I I I II I I I I II I I II I II I I I II II I I I M I I II I I I I I I I I I I II 
Db 65 CACTGTTTATTTTTTTAAAACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAA 12 4 

Qy 2442 AGCACAGTCTGATGACACATTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGA 2501 

I I I I I I I I I I I I I I II M I M I II I I M M I I II I I I I I I I M I M I I I I I I I I I I I M I 

Db 125 AGCACAGTCTGATGACACATTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGA 184 

Qy 2502 ACTGTATTTTATTTTTT7\AATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATG 2561 

I I I I M I I I I I I I I I M I I I I I M II I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 185 ACTGTATTTTATTTTTTAAATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATG 24 4 

Qy 2562 TTAAATTCT^AAAGTAATGCTTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTT 2 621 

I I I I I I I I I I I I I I I I I I I I II I I II I I I I I i I I II I I M I II I I I I I I I I I I I I I I I I 
Db 245 TTT^TTCAAAAGTAATGCTTCAATCAGATAGTTCTTTTTCACAAGTTCT^T-CTGTTTT 303 

Qy 2622 TCATGTAAATTTTGTATGAAAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCAT 2681 

M I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 304 TCATGTAT^TTTTGTATGAAAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCAT 363 

Qy 2682 TTAACTCTGCCTGAGACTTTCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGA 27 41 

I II i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I t I I I I I I I I I I I I II II I I I 
Db 364 TTAACTCTGCCTGAGACTTTCAGTGCACTGTATATAGAAGTCTACAACACACCTAAGAGA 423 

Qy 2742 AAAAGATCGAATTTTTCAGATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACA 2801 

I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 42 4 AAAAGATCGAATTTTTCAGATGATTCAGAAATTTTGATTCAGGTATTTGTAATAGTGACA 4 83 

Qy 2802 TATATATGTATATACATATCACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGC 28 61 

I II I I I I I I I I I I II I I I I II M I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I M I 
Db 48 4 TATATATGTATATACATATCACCTCCTATTCTCTTAATTTTTCTTA7WVTGTTAACTGGC 543 

Qy 2862 AGTAAGTCTTTTTTGATCATTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAG 2921 

I I I M I I I I I I I II I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I M I I I I III 
Db 544 AGTAAGTCTTTTTTGATCATTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGNCAG 603 



Qy 2922 ATGAGTTTATCATGTCAGTGAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGAT 2 981 

I I I I I I I I I I I I I I I II I I II II II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 



Db 604 ATGAGTTTATCATGTCAGTGAAAAAT7\ATTACCCAC7U\ATGCCACCAG — AACTTACGAT 661 

Qy 2982 TCTTCACTTCTTGGGGTTTTCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCA 3041 

II I I I I I II I I I I I I I I II I I I I I I I I I I I I II II I I I II I I II II I II II II I I I I M 
Db 662 TCCTCACTTCTTGGGGTTTTCAGTATGAACCTAACTCCCCACCCC7UVCATCTCCCTCCCA 721 

Qy 3042 CATTGTCACCATTTCAAAGGGCCC 3065 

I I I I I II II I II I I I II II I 

Db 722 CATTGGCACCANTTCAAAGGGGNC 745 



RESULT 14 

CD246193 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



CD246193 782 bp mRNA linear EST 22-MAY-2003 

AGENCOURT_14126996 NIH_MGC_145 Homo sapiens cDNA clone 
IMAGE: 6912753 5', mRNA sequence. 
CD246193 

CD24 6193 .1 GI : 31006657 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 782) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 
Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: GPCR Consortium 
cDNA Library Preparation: GPCR Consortium 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : / /image . llnl . gov 
Plate: IRBIOI row: a column: 08 
High quality sequence stop: 640. 
Location/Qualifiers 
1. .782 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref-"taxon: 9606" 

/clone="IMAGE: 6912753" 

/tissue_type="mixed" 

/lab_host-"DH10B" 

/clone_lib="NIH_MGC_145" 

/note="Vector : pcDNA3.1; Site__l: varies by clone; Site_2 : 
varies by clone; ORFs were PGR- amplified and cloned into 
pcDNA3.1 by the GPCR Consortium. Cloning sites vary by 
clone and include the following: 5 * -EcoRV-Xmnl/XhoI-3 * , 
5'-EcoRV-Xmnl/NotI-3* , EcoRV (TA cloned, non-directional). 
For information about which gene each clones represents, 
please visit our anonymous ftp site at 

ftp : //image . llnl . gov/image/rearrayed_plates/lRBI . preSV. dat 
a Note: this is a NIH MGC Library." 



ORIGIN 



Query Match 16.9%; Score 694.8; DB 14; Length 782; 

Best Local Similarity 99.7%; Pred. No. 1.4e-143; 

Matches 696; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 4 85 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 

Mill I I I I I II I I I II I II I I II I I I I I I M I I I I I I I I II II II II I I I I II I I I M 
Db 9 ATGGATACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 68 

Qy 545 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 604 

I I I I I I I I I I I I I I I I II I M I I I I I II I I I II I II I I I I I I I M I I I I I I I I I I II I I I 

Db 69 GAT7\ATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 12 8 

Qy 605 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 9 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 18 8 

Qy 665 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACT7Wy\TTACTTCAGCTTTCAAA 724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 189 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 24 8 

Qy 725 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGG7\ATGCAACT 7 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 9 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGT^ATGGTGGGGAATGCAACT 308 

Qy 785 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 84 4 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 309 CTGCTCAGGATCATTTACCAGAAC7VAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 368 

Qy 8 45 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 369 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 42 8 

Qy 905 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 

I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 429 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 488 

Qy 965 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1024 

I I M I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 489 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 54 8 

Qy 1025 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1084 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 549 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 608 

Qy 1085 GTT^CTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 114 4 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n I I I I I I I I I I I I I 

Db 609 GTAACTGCCATTGAAATTGTCTCCCTCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 668 

Qy 1145 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGG 1182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 669 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGG 706 



RESULT 15 

AI694278/C 

LOCUS AI694278 



739 bp mRNA linear EST 17-DEC-1999 



DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
COMMENT 



FEATURES 

source 



wd45a01.xl Soares_NFL_T_GBC_Sl Homo sapiens cDNA clone 
IMAGE:2331048 3' similar to gb:S57498 ENDOTHELIN-1 RECEPTOR 
PRECURSOR (HUMAN);, mRNA sequence. 
AI694278 

AI694278.1 01:4971618 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 739) 

NCI-CGAP http : / /www . ncbi . nlm. nih . gov/ncicgap . 

National Cancer Institute, Cancer Genome Anatomy Project (CGAP) , 

Tumor Gene Index 

Unpublished (1997) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs-r@mail.nih.gov 

This clone is available royalty-free through LLNL ; contact the 
IMAGE Consortium (info@image.llnl.gov) for further information. 
Insert Length: 1706 Std Error: 0.00 
Seq primer: -40UP from Gibco 
High quality sequence stop: 458. 

Location/Qualifiers 

1. .739 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref ="taxon : 9606" 
/clone="IMAGE: 2331048" 
/lab_host="DH10B" 

/clone_lib="Soares_NFL_T_GBC_Sl" 

/note="Organ: pooled; Vector: pT7T3D-Pac (Pharmacia) with 
a modified polylinker; Site_l: Not I; Site_2 : Eco RI; 
Equal amounts of plasmid DNA from three normalized 
libraries (fetal lung NbHL19W, testis NHT, and B-cell 
NCI CGAP_GCB1) were mixed, and ss circles were made in 
vitro. Following HAP purification, this DNA was used as 
tracer in a subtractive hybridization reaction. The driver 
was PCR-amplified cDNAs from pools of 5,000 clones made 
from the same 3 libraries. The pools consisted of 
I.M.A.G.E. clones 297480-302087, 682632-687239, 
726408-728711, and 729096-731399. Subtraction by Bento 
Soares and M. Fatima Bonaldo. " 



ORIGIN 



Query Match 16.9%; 
Best Local Similarity 98.2%; 
Matches 723; Conservative 



Score 694.4; DB 9 
Pred. No. 1.7e-143 
0; Mismatches 11 



Length 739; 

Indels 2; Gaps 2; 



Qy 


3370 


CTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAGGCAGC 

1 1 I 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II II 1 II II 1 II M 1 1 1 II 1 II II 
CTTCCGCATTCAT-AATCCTGTATTCATGTT-CCCTTCCAAATGGGATATAAGAGGCAGC 


3429 


Db 


739 


682 


Qy 


3430 


GTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGTTTGAT 

1 1 1 1 1 1 1 II 1 M 1 1 M 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 M M 1 1 1 1 1 

GTGAAAGCAGATGAGCTGTGGACTACAAATATAGGGTTTTGTTTGGTTGGTTGGTTTGAT 


3489 


Db 


681 


622 



Qy 



34 90 AAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACTTTGAA 3549 



Db 


621 


AAAGCAGTATTGGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCAl lAuACi IbAAA 




Ov 


3550 


GTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTCTGATA 


3609 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


561 


GT ATT AT AT T GT T CT TAT C CT CAATT CAAT GT GGT GAT GAAAT T G C CAGGTT GT CT GAT A 




Ov 


3610 


TTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATTTGTTGG 


3669 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


501 


T T T CTTT CAGACT T C GC C AGAC AGATT GCT GAT AAT AAAT TAG GTAAG AT AAT T T GT T GG 


A AO 
^ ^ Z 


Ov 


3670 


GCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAGGCTAA 


3729 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 M 1 1 1 M 1 1 M M 1 1 1 1 1 1 1 1 1 1 




Db 


441 


GCCATATTTTAGGACAGGT7\AAATAACATCAGGTTCCAGTTGCTTGAATTGCAAGGCTAA 


"3 Q O 


Ov 


3730 


GAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATCATATG 


3789 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


381 


GAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATCATATG 


Q o o 


Ov 


3790 


CAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAATTGTC 


3849 




1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 




Db 


321 


CAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAATTGTC 


O o 
Z DZ 


Ov 


3850 




3909 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


261 


TTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTCAGAAA 


o n o 
z Uz 


Ov 
vy 


3910 


GTCATAGATTTCTG7VAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAACTGTGG 


3969 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


201 


GTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTT^GTAACTGTGG 


1 /I o 

14z 


Ov 


3970 


TTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTAACTTT 


4029 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 t 1 1 




Db 


141 


TTTACTAGCAGGACTATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTAACTTT 


82 


Qy 


4030 


GTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAAAATA7\A 


4 u o y 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 M 1 1 1 M 1 M 1 M 1 1 1 




Db 


81 


GTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAAAATAAA 


22 


Qy 


4090 


AGTTTACAGAAACCTT 4105 




Db 


21 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGTTTACAGA7\ACCTT 6 





Search completed: May 14, 2004, 15:45:57 
Job time : 9734.65 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



May 13, 2004, 23:17:23 ; Search time 15507.3 Seconds 

(without alignments) 

11473.517 Million cell updates/sec 



Title: US-09-931-157-1 
Perfect score: 4105 

Sequence: 1 gaattcgcggccgcctcttg taaaagtttacagaaacctt 4105 



Scoring table: 



Searched: 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1,0 

3470272 seqs, 21671516995 residues 



Total number of hits satisfying chosen parameters; 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



6940544 



Database 



GenEmbl : * 



1 
2 
3 
4 
5 
6 
7 
8 
9 

10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 



gb_ba : * 
gb_htg : * 
gb_in : * 
gb_om : * 
gb_o V : * 
gb__pat : * 
gb_ph : * 
gb__pl : * 
gb_pr : * 
gb^ro : * 
gb_sts : * 
gb_s y : * 
gb_un : * 
gb_vi : * 
em_ba : * 
em_f un : ^ 
em_hum : * 
em_in : * 
em__mu : * 
em_om : * 
em_or : * 
em_o V : * 
em_pat : * 
em_ph : * 
em_pl : * 
em__ro : * 
em sts:* 



28 


em 


un: * 


29 


em 


vi : * 


30 


em 


htg hum:^ 


31 


em 


htg inv:* 


32 


em 


_htg_other : * 


33 


em 


htg mus : * 


34 


em 


htg pin:* 


35 


em_ 


_htg_rod: * 


36 


em 


htg mam:* 


37 


em 


htg vrt:* 


38 


em 


sy : * 


39 


em 


htgo hum:* 


40 


em 


htgo mus : * 


41 


em 


htgo other:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMM7VRIES 

% 

Result Query 



No. 


Score 


Match 


Length 


DB 


ID 


Description 


1 


4105 


100. 


0 


4105 


6 


AR177879 


AR177879 Sequence 


2 


4105 


100. 


0 


4105 


6 


E07649 


E07649 cDNA encodi 


3 


4105 


100. 


0 


4105 


6 


AX548830 


AX548830 Sequence 


4 


4105 


100, 


0 


4105 


6 


AX587759 


AX587759 Sequence 


5 


4105 


100. 


0 


4105 


9 


HSETIR 


X61950 H. sapiens m 


6 


4103 


100. 


0 


4105 


6 


BD231376 


BD231376 Genes for 


7 


4103 


100. 


0 


4105 


9 


S57498 


S57498 endothelin 


8 


4101 


99. 


9 


4101 


9 


HUMETNIR 


D90348 Homo sapien 


9 


4079 


99, 


4 


4079 


6 


AR270694 


AR270694 Sequence 


10 


3183.2 


77. 


5 


3305 


9 


S45956 


345956 endothelin 


11 


2609.6 


63. 


6 


2705 


9 


BC022511 


BC022511 Homo sapi 


12 


2470 


60. 


2 


2595 


6 


BD169895 


BD169895 Method fo 


13 


2470 


60. 


2 


2595 


9 


D11144S8 


D11151 Homo sapien 


14 


2409.2 


58. 


7 


164920 


9 


AC093908 


AC093908 Homo sapi 


15 


2406.6 


58. 


6 


67986 


9 


AY422989 


AY422989 Homo sapi 


16 


2292 


55. 


8 


2337 


11 


G06463 


G064 63 human STS W 


17 


1819.6 


44. 


3 


1868 


9 


S63938 


S63938 A-type endo 


18 


1786.6 


43. 


5 


3216 


4 


BTBETREC 


X57765 Bovine mRNA 


19 


1560.2 


38. 


0 


1661 


9 


S67127 


S67127 endothelin 


20 


1359 


33. 


1 


1359 


9 


S81539 


S81539 endothelin- 


21 


1296.8 


31. 


6 


1310 


9 


HUMEDNRA 


L06622 Homo sapien 


22 


1280.8 


31. 


2 


1284 


6 


AX280871 


AX280871 Sequence 


23 


1280.8 


31. 


2 


1284 


9 


AY275462 


AY275462 Homo sapi 


24 


1122 


27. 


3 


1374 


4 


S80652 


380652 endothelin 


25 


1103.2 


26. 


9 


1284 


4 


AF416703 


AF416703 Ovis arie 


26 


1088.2 


26. 


5 


2696 


10 


BC008277 


BC008277 Mus muscu 


27 


1048.8 


25, 


5 


1180 


4 


AF311974 


AF311974 Oryctolag 


28 


1021 


24. 


9 


1021 


11 


G10643 


G10643 human STS C 


29 


997 


24 . 


3 


1436 


10 


RATENDOR 


M60786 Rat endothe 


30 


951 


23. 


2 


1160 


9 


S81542 


381542 endothelin- 


31 


765.8 


18. 


7 


2944 


5 


AF040634 


AF040634 Gallus ga 


32 


765.8 


18. 


7 


2988 


5 


AF472618 


AF472618 Gallus ga 


33 


695 


16. 


9 


1032 


9 


S81545 


S81545 endothelin- 



34 


635 


15 . 


5 


3767 


5 


BC04 4316 


BCu44oiD Aenopus x 


35 


632 . 8 


15 . 


4 


1650 


5 


XLU06633 


U06633 Xenopus lae 


36 


624 , 6 


15 . 


2 


810 


10 


AFujy oyz 


ArUoyoyz r'ius inuscu 


37 


514 


12 . 


5 


530 


9 


MFU20577 


U20577 Macaca fasc 


38 


492 . 4 


12 . 


0 


531 


9 


D11144S2 


D11145 Homo sapien 


39 


487 . 4 


11 . 


9 


1435 


9 


S55547S2 


Sod I 1 Z biA— enaoune 


40 


487 . 4 


11. 


9 


66264 


2 


AC110065 


AC110065 Homo sapi 


41 


435.6 


10. 


6 


3157 


5 


BC048223 


BC048223 Xenopus 1 


42 


425 


10. 


4 


1308 


5 


CCEDNRB2 


Y16089 Coturnix co 


43 


423.4 


10. 


3 


2225 


5 


AF472617 


AF472617 Gallus ga 


44 


411.6 


10. 


0 


1724 


5 


AB045356 


AB045356 Oryzias 1 


45 


411 


10. 


0 


1314 


4 


AF276427 


AF276427 Canis fam 



ALIGNMENTS 



RESULT 1 
7VR177879 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



ORIGIN 



AR177879 



4105 bp 



DNA 



Sequence 1 from patent US 6313276. 
AR177879 

AR177 87 9. 1 GI: 17 9202 34 

Unknown . 

Unknown . 

Unclassified, 

1 (bases 1 to 4105) 

Imura,H., Nakao^K. and Nakanishi,S. 

Human endothelin receptor 

Patent: US 6313276-A 1 06-NOV-2001; 

Location/Qualifiers 

1. .4105 

/ organism="unknown" 

/mol type="unassigned DNA" 



linear PAT 17-DEC-2001 



Query Match 100.0%; Score 4105; DB 6; Length 4105; 

Best Local Similarity 100.0%; Fred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I M I 
Db 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 



Qy 

Db 



61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I 

61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 



Qy 

Db 

Qy 

Db 



121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I 

181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 



Qy 241 GCAGTGCCCAGG7UVGTTTTCTGAAGCCGGGG7\AGCTGTGCAGCCG7\AGCCGCCGCCGCGC 300 

I I I I I I I I I I I I I M I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

Qy 301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I M I I 

Db 301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

Qy 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 42 0 

Qy 421 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAAT7SAGAGATATTTCCTCAAATTTGCCT 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AA7U\AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

Qy 481 CAAGATGGATVACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I 

Db 481 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

Qy 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I M I I I I I I I 

Db 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGC7\ATCATGTGGATGATTTCACCAC 600 

Qy 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I M I I 

Db 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

Qy 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTATVAATTACTTCAGCTTT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db, 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I 

Db 721 CAAATACATT7\ACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

Qy 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M 

Db 781 7\ACTCTGCTCAGGATCATTTACCAGAACA7VATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I M I I I I I i I I I I I 

Db 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

Qy 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

I I I M I I I I I I I I I I I I I I I M I I I I M I I I I I I M I I I I I M M I I I I I I I I I I I I I I I 

Db 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGG7\ATTGGGATTCC 1080 



Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 12 00 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 1200 

Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACC7UVGATGTAAAGGACTGGTGGCT 12 60 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTG7\ACATCTT7UV 1380 

Qy 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 

I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I M I I 
Db 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 

Qy 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGTyyVTTTAAAAATTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAT^ATTTAAAAATTG 1620 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

Qy 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

Qy 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 01 AATCCTCTCGGAGATWyW^TCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCA7WVCCGCAAGGTAGA 1920 

Qy 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 



Db 


1921 


Qy 


1981 


Db 


1981 


Qy 


2041 


Db 


2041 


Qy 


2101 


Db 


2101 


Qy 


2161 


Db 


2161 


Qy 


2221 


Db 


2221 


Qy 


2281 


Db 


2281 


Qy 


2341 


Db 


2341 


Qy 


2401 


Db 


2401 


Qy 


2461 


Db 


2461 


Qy 


2521 


Db 


2521 


Qy 


2581 


Db 


2581 


Qy 


2641 


Db 


2641 


Qy 


2701 


Db 


2701 


Qy 


2761 


Db 


2761 



1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 
TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2040 

I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I 

TTCTGCGTGTTGTATTCAGCACTAATWyVTGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2 04 0 

AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGATVACTTTAG 2160 

AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

ATATGGGCTCAGGTCACTTTTATTTG7WVTGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I M I 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 8 0 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG7WW\A7W\AGACAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGAC7V7\A 234 0 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTATiA 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACACTW^TTCTTWVGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 252 0 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I 

ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 258 0 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I 
TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2 64 0 

AAAATCAATGTCTVAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

I M I I I I I I I I I I I I I I M I I I I I I I I I I I I M I M I I I I I I I I I I I I M I I I I I I I I M 

AAAATCAATGTCAAGTACCAAAATGTTT^TGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2 82 0 

I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 



2 821 CACCTCCTATTCTCTT7\ATTTTTGTTAAAATGTT7\ACTGGCAGTAAGTCTTTTTTGATCA 2880 

I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I I I I I I 
2821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 

28 81 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I 

2 881 TTCCCTTTTCCATATAGGATy^CATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

2 941 GAAAAATAATTACCCACT^AATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

2941 GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I M I I 
3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTC7WVG 3060 

3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATA7\ACAATTGTAAATTTCTTTTAGCCC 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

I I I I I I I I I I I I I I I I I I I M I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 

3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3241 GGTATGTATGGATTTAATCTAATCTAAT7UVTTGTGCCCCGCAGTTGTGCC7\AAGTGCATA 3300 

3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I M M I I I I I I I I I I I I I I I I I M I I M I I I M I I I I I I M I I I I I I I I I I I I I I I I I 

3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACTyVCCTGCCTCAGTCCATTTTAACC 3360 

3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

3421 AGAGGCAGCGTGATVAGCAGATGAGCTGTGGACTAGCi^ATATAGGGTTTTGTTTGGTTGGT 34 8 0 

I I I I M I I I I I M M M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I 

3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I 

34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I 

3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATATWVTTAGGTT^AGATA 3660 



Qy 


3661 


Db 


3661 


Qy 


3721 


Db 


3721 


Qy 


3781 


Db 


3781 


Qy 


3841 


Db 


3841 


Qy 


3901 


Db 


3901 


Qy 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



ATTTGTTGGGCCATATTTTAGGACAGGTAAT^ATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M 
CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTC7\AATCTATTATTCCACTGGCG 3780 

CATCATATGCAGTGATATATGCCTAT7\ATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAA7WVTGCATTTTATAA 39 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATG7\AAAAAATGCATTTTATAA 3900 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I 
ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I 

AGTAACTTTGTAGAAATGAGCCAG/^GCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I I I I 

TAAAATAAAAGTTTACAGAAACCTT 4105 



RESULT 2 

E07649 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 



E07649 4105 bp RNA linear PAT 29-SEP-1997 

cDNA encoding endothelin receptor , ETA-receptor . 

E07649 

E07649. 1 GI :2175784 
JP 1994157595-A/l. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 4105) 

Imura,H.^ Nakao,I. and Nakanishi, S . 

HUMAN ENDOTHELIN RECEPTOR 

Patent: JP 1994157595-A 1 03-JUN-1994; 



SHIONOGI 
OS 
PN 
PD 
PF 



& CO LTD 



Homo sapiens (human) 
JP 1994157595-A/l 
03-JUN-1994 

12-JUL-1991 JP 1991172828 
PI IMURA HIROO, NAKAO ICHIKAZU, NAKANISHI SHIGETADA PC 
C07K13/00,C12N5/10,Cl2N15/12,C12P21/02, (C12N5/10, C12R1 : 91 ) , PC 
(C12P21/02, 
PC C12R1:91); 



cc 
cc 
cc 
cc 

FH 
FH 
FT 
FT 
FT 
FT 
FT 
FT 
FT 



strandedness : Double; 
topology: Linear; 
hypothetical; No; 
anti-sense: No; 



Key 



Location/ Qualifiers 



source 1. .4105 

/organism=^ * Homo sapiens' 
/ tissue_type= ' placenta * 
/clone='phETIR* 
5'UTR 1. .484 

CDS 485. .1768 

/product=' endothelin receptor , ETA-receptor ' FT 
sig_peptide 485. .544 

FT /product^ * signal peptide of endothelin FT 

receptor^. 
FT ETA-receptor ' 

FT mat_peptide 54 5. .1765 

FT /product=' endothelin receptor , ETA-receptor ' FT 

3'UTR 1769. .4105 

FT polyA_signal 4084. .4089. 
FEATURES Location/Qualifiers 
source 1. .4105 

/organism="Homo sapiens" 
/mol^type^" genomic RNA" 
/db_xref="taxon: 9606" 

ORIGIN 



Query Match 100.0%; Score 4105; DB 6; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 

Db 



1 G7VATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 



Qy 

Db 



61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I M M I 
61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 



Qy 



361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGTWVA 420 



361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 420 

421 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAAT7\AGAGATATTTCCTCAAATTTGCCT 4 80 

I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
421 AA7WVGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

481 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 CAAGATGGTWVCCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I 

541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I 
601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

661 ACCCAGCTUVTGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 72 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I M I I I 
661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

721 C7WVTACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 78 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I 

721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I 
841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 

901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCTy^CCTCTGCGCTCT 102 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

1081 TTTGGTAACTGGCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 1200 

1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I M I I I I M I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I M I I I I M I I I I I I I I I 



Db 



12 01 TATGCTCAATGCCACATC7\A7y^TTCATGGAGTTCTACC7\AGATGTA7\AGGACTGGTGGCT 1260 



Qy 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 


Qy 


1441 


Db 


1441 


Qy 


1501 


Db 


1501 


Qy 


1561 


Db 


1561 


Qy 


1621 


Db 


1621 


Qy 


1681 


Db 


1681 


Qy 


1741 


Db 


1741 


Qy 


1801 


Db 


1801 


Qy 


1861 


Db 


1861 


Qy 


1921 


Db 


1921 


Qy 


1981 


Db 


1981 


Qy 


2041 


Db 


2041 



CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I M I I I I I I I I I I M I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAG7\ATTGCCCTCAGTG7y\CATCTTAA 1380 

GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I 

GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 40 

GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I 

GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGC7\AC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I 

CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

CATGAATTCATGTATAT^CCCCATAGCTCTGTATTTTGTGAGCT^AGTWVTTTAAAAATTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAA7VATTG 1620 

TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCC7\AAAGTCTGATGACCTCGGTCCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I 

TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 168 0 

CATGAACGG7^CAAGCATCCAGTGG7\AGAACCACGATCAAAACAACCAC7U\CACAGACCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

CATGAACGG7U\C7\AGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I M I I I I I I I 

GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

AATCCTCTCGGAGATWyWVTCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

AATCCTCTCGGAGTWWW^TCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I 

CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 192 0 

CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M 

CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 198 0 

TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2040 

I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2040 

A7\ATGA7\ACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTC7^AGTACATGG 2100 
! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I 

AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 



Qy 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 


2160 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACi i iAtj 


9 1 i^n 
^1 X oU 


Qy 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 


2220 




1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGAI 1 1 i i iGiUUl i L.AbUOAA/\UAU/\ 




Qy 


2221 


ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 


2280 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2221 


AT AT GG GOT C AG GT CACT T T TAT T T GAAAT GT C AT TT GGT GC CAGT ATT T T T T AAC T GC A 


o o Q n 
o u 


Qv 


2281 


TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 


2340 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 




Db 


2281 


TAATAGCCTAACATGATTATTT GAACT TATTTACACAT AGTTTGAAAAAAAAAAGACAAA 


o o yi n 
Zo4 U 


Qy 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 


2400 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2341 


AAT AGT AT T C AGGT GAGCAAT T AGAT T AGT ATTT T C CAC GT C AC TAT T TAT T T T T T TAAA 


Z4 UU 


Qv 


2401 


ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 


2460 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2401 


ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 


4 bU 


Qv 


2461 


TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTT^ 


2520 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 




Db 


2461 


T T T GGCAGTT T AAT AGAT GT TACT CAAAGAATT T T T T AAG7VACT GT AT T T T AT TT T TTAA 


9 c; o n 


Ov 


2521 


ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAA7\AGTAATGC 


2580 




1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2521 


AT GGT GT T T TAT T ACAAGG GAC CT T G7VACATGTT T T GT AT GTT AAAT T CAAAAGT AAT GC 


9 c: Q n 
^1 o o U 


Qv 


2581 


TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 


2640 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2581 


TT CAAT C AGAT AGT TCT T T TT CACAAGT T CAAT ACT GTT T T T CAT GT AT^TT T T GT AT GA 




Qy 


2641 


AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 


2700 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 




Db 


2641 


AAAAT CAAT GT CAAGT AC CAAAAT GTT AAT GT AT GT GT CAT T T AAC T CT GC CT GAGACTT 


9 "7 n n 


Qy 


2701 


TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 


2760 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2701 


T CAGT G CACT GT AT AT AGAAGT CTAAAAC ACACCTAAGAGAAAAAGAT CGAAT T T T T C AG 


O T fl 


Qy 


2761 


ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 


2820 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2761 


ATGATTCGGAAATTTTCATTCAGGi Ai i iGiAAiAGiGACAiAlAiAKalAiAlAUAlAi 


9 p 9 n 
z o z u 


Qy 


2821 


_ j^rfi y-^ m -n rr-i m -r-*i m * mm Tk TV mmmm m m m Tv "Tv "A Tv m m m Tv Tv m /"^ tv m TV TV rp rf^rprp rp rp rp rp "A rp 7\ 

CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTi i J. i iGAi CA 


9 p p n 
z O 0 u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2821 


CACCTCCTATTCTCTTAATTTTTGTTAAT^TGTTAACTGGCAGTAAGTCTTTTTTGATCA 


2880 


Qy 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 


2940 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 




Db 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 


2940 



Qy 2941 GAA7\AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I M I I I I I I 
Db 2941 GAAAAATTVATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I 
Db 3001 TCAGTATGTUVCCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 30 60 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

Qy 3121 7W\ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGT7WVTTTCTTTTAGCCC 3180 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I 

Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 

Qy 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

Qy 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I I I I M I I I I I I I I I I I I 11 I I I I I I I I I I M I I I I I I I I I I I I I I M M M I I 
Db 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I M I I I I I I I I I I I I I I M 
Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 342 0 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 3480 

I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M 1 I I I I I 
Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

Qy 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGC7UWVGTCATTA 354 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M 
Db 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGTWVTTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATA7\ATTAGGTAAGATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

Qy 3721 CAAGGCTAAGT^GTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 3721 CAAGGCTAAGTUVGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 



Qy 



3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 



Db 


3781 


Ov 


3841 


Db 


3841 


Ov 


3901 


Db 


3901 


Ov 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCTVACA 4020 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I M I I I I I I I I I I I M I I I I I I 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I I I I 

T7\7\AATAAAAGTTTACAGAAACCTT 4105 



RESULT 3 
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PAT 26-NOV-2002 



AX548830 4105 bp DNA linear 

Sequence 115 from Patent WO02061087. 

AX548830 

AX548830.1 GI:25813724 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Burmer^G.C, Roush^C.L. and Brown, J. P. 

Antigenic peptides, such as for G protein-coupled receptors 
(GPCRs), antibodies thereto, and systems for identifying such 
antigenic peptides 

Patent: WO 02061087-A 115 08-AUG-2002; 
Lifespan Biosciences, Inc. (US) 

Location/ Qualifiers 

1. .4105 

/organism="Homo sapiens" 
/moi_type="unas signed DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 100.0%; Score 4105; DB 6; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 4105; Conservative 0; Mismatches 0; 



Length 4105; 
Indels 0; 



Gaps 



0; 



Qy 

Db 



1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

1 G7VATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 



Qy 61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 

M I I I I I I I I I M M I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I M I I 

Db 61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 

Qy 121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 

Db 121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

Qy 181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I M I I I I I I I I M I I I I I I I I I 

Db 181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

Qy 241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

Qy 301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

Qy 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 420 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I 
Db 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 420 

Qy 421 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGC7\ATAAGAGATATTTCCTCAAATTTGCCT 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I 1 I I I I I I I I I 
Db 421 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

Qy 481 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 540 

I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I M I I I I M M I I 

Db 481 CT^GATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 540 

Qy 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

I I M I I I I I I I I I I I I I M M I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

Qy 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATC7\ACCCACTAATTTGGTCCT 660 

Qy 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTTW^ATTACTTCAGCTTT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 

Db 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 78 0 

Qy 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGi\ATGGCCCCAACGCGCTGAT 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

Qy 901 T7U\GCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 



Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGArCACAATGACTTTGGCOi Ai i IL-i i 


-7 O U 


Qv 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGC i o i 


1 n9 n 


Qv 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


1080 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAAi iGGGAi luu 


1 n R n 

X U o u 


Qy 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1081 


TT T GGTAACT GC CAT T GAAAT T GT CT C C AT CT GGAT C CTGT C CT TT AT C CT GGC CAT T C C 


1 1 /I n 
X 1 4 U 


Qv 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 


1200 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 




Db 


1141 


T GAAGC GATT GGCT T C GT CAT GGT AC CCT T T GAAT AT AGGGGT GAAC AGCAT AAAAC CT G 


1 o n n 
xz u u 


Ov 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1201 


TAT GCT CAAT GC CAC AT CAAAAT T C AT GGAGT T C T AC CAAGAT GT AAAGGACT G GT GGCT 


iz bU 


Ov 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 M 1 1 M 1 1 1 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


T Q o n 
ioz U 


Qv 


1321 


TTGTGAGATGTTGAACAGTVAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1321 


T T GT GAGAT GT T GAACAGAAGGAAT G GC AGCT T GAGAATT GC C CT C AGT GAAC AT CT T AA 


n Q Q n 


Qv 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


GCAGCGTCGAGAAGTGGCATWKACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


n /t yi n 
14 4 U 


Qv 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTAT7\ACGAAATGGACAAGAA 


1500 




1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


GTT C C C T CT T CACTT AAGC C GT AT AT T GAAGT^AAACT GT GT AT AAC GAAAT GG ACAAGAA 


X o u u 


Qv 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


C CGAT GT GAAT T ACT T AGT T T CT T ACT G CT CAT GGAT T AC AT C G GT AT TAACTT GGCAAC 


1 i^n 

i D oU 


Qy 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAATUVATTG 


1620 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1561 


CAT GAAT T CAT GT AT AAAC C C CAT AGCT CT GT AT T T T GT GAGCAAGAAATT T AAAAATT G 


1 DZ u 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 




JJD 




TTTmarTraTrrrTrTf^rTr^rTf^rTnTTArrAGTrCAAAAGTCTGATGACCTCGGTCCC 


1680 


Qy 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1740 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1681 


CATGAAC GGAACAAGCAT CCAGT GGAAGAAC CAC GAT C7\AAACAAC CACAAC ACAGACCG 


1740 


Qy 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 



1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 



Qy 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 




, 1 , 1 1 1 1 1 1 1 1 1 1 1 1 1 ) 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 t 1 1 1 t 1 

1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N I 1 M 1 1 




Db 


1801 


AAT C CT CT C GGAGAAAAAAAT C ACAAG GCAACT GT GACT C CGGGAAT CT CT T CT CT GAT C 




Qy 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAA7\ACCGCAAGGTAGA 


1920 




, , , 1 1 1 1 1 I t 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 t 1 t t 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 t 1 1 1 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M M M 1 M 




Db 


1861 


CT T CTT C CTTAATT CACT CC CAC AC CCAAG7\AG7\AAT GCT T T C CAAAAC C GCTUVG GT AGA 




Qy 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1921 


C T G GTT TAT C CACC CACAACAT CT ACGAAT C GT ACT T CTT T AAT T GAT CTAAT T T ACAT A 


1 Q Q n 


Qy 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGT^ATGAAGACTGTT 


2040 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 


Qy 


2041 


AAAT GTW^C CAG7\AGGAT AT T TACT ACT TTT GCAT G7W\AT AGAGCTTT CAAGT AC AT GG 


2100 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 


2100 


Qy 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATG7WVCTTTAG 


2160 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 


2160 


Qy 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTT^GTGATTTTTTGTCCTTCAGCCAAACACA 


2220 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 M 1 




Db 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 


2220 


Qy 


2221 


ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 


2280 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


2221 


ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTT^CTGCA 


O O O A 


Qy 


2281 


TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAA7y\Ai\AAAGACAAA 


2340 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


2281 


T7\ATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAA7W^GACAAA 


2340 


Qy 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 


2400 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


2341 


AAT AGT AT T CAGGT GAGCAAT T AGAT T AGT AT T T T C CAC GT C ACT AT T TAT T T T T T TAAA 


z4Uu 


Qy 


2401 


ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 


2460 




, , 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


2401 


AC ACAAAT T CTA7\AGCT ACAACAAAT ACT ACAGG CC CT TT^^AGC AC AGT CT GAT GACACA 


O A £^n 
Z 4 bU 


Qy 


2461 


TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 


2520 






,11 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 r 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M M M 1 1 1 M M M M 1 1 1 M M M 1 M M M 1 




Db 


2461 


TTT G GC AGT T TAAT AGAT GT T ACT CAAAGAAT T T TT T AAGT^CT GT AT T TT AT T T T TT7\A 


o c; o n 


Qy 


2521 


ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGT7\ATGC 


2580 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


2521 


ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 


2580 


Qy 


2581 


TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 


2640 




1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


2581 


TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 


2640 



Qy 2641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 2641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

Qy 27 01 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGA7\7\AAGATCGAATTTTTCAG 2760 

Qy 27 61 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I M I I I I I I I I I I I I M I M I 
Db 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

Qy 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I 
Db 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 8 0 

Qy 28 81 TTCCCTTTTCCATATAGG7WVCATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 2881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

Qy 2941 GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 GAAAAATAATTACCCACA7UVTGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 30 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 TCAGTATGAACCTAACTCCCCACCCC7\ACATCTCCCTCCCACATTGTCACCATTTCA7^G 30 60 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

Qy 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATAT7WVCAATTGTAAATTTCTTTTAGCCC 318 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I i I I I I 

Db 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 40 

Qy 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I 
Db 3241 GGTATGTATGGATTTAATCTAATCTT^TAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

Qy 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M M I I I I I 
Db 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 342 0 

I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I 
Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I 
Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 



Qy 


3481 


Db 


3481 


Qy 


3541 


Db 


3541 


Qy 


3601 


Db 


3601 


Qy 


3661 


Db 


3661 


Qy 


3721 


Db 


3721 


Qy 


3781 


Db 


3781 


Qy 


3841 


Db 


3841 


Qy 


3901 


Db 


3901 


Qy 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I I I 
TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I 
CACTTTGAAGTATTATATTGTTCTTATCCTCAATTC7\ATGTGGTGATGAAATTGCCAGGT 3600 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

CAAGGCTAAGi\AGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

II I I I II I I I i I I I I I I I I M I I II II M I II I I I II II M I 

CAAGGCTAAGT^GTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

I II I I II I I M M II I I I I M II I I II I I I II M I II II I II I I I I I I I II I 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 40 



I I I II II M II I II II I I M II I I II II I II M I I II II I II II I I I I M II I I I I I I I 



ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I II I 11 II II II I I I II I I I I II I I II I I I I I I I I I II II II I I II II I I I II I I 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

I I I II I II I I I I I I I I I I I I I I II I I I I I I I M I I I II II M I I II I I I I I I I I I I I I I I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 
I I I II I I I I I I II I II I I I M I II II II I I M II I I I II I I I II M II I I I M I I I I I I I 
AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 

TAAAAT7\AAAGTTTACAG?AACCTT 4105 

I I I I I I I I I I I I I I I I I I I I II II I 

TAAAATAAAAGTTTACAGAAACCTT 4105 



RESULT 4 
AX587759 

LOCUS AX587759 4105 bp DNA linear PAT lO-Ji^N-2003 

DEFINITION Sequence 229 from Patent WO0246467. 

ACCESSION AX587759 

VERSION AX587759.1 GI:28212399 
KEYWORDS 

SOURCE synthetic construct 

ORGANISM synthetic construct 

artificial sequences. 

REFERENCE 1 

AUTHORS Bertucci,F., Houlgatte, R. , Birnbauiu, D , , Nguyen, C, Viens^P. and 



Fert,V. 

TITLE Gene expression profiling of primary breast carcinomas using arrays 

of candidate genes 
JOURNAL Patent: WO 0246467-A 229 13-JUN-2002; 
Ipsogen (FR) 
FEATURES Location/Qualifiers 
source 1. .4105 

/organism=" synthetic construct" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 32630" 
/note=="primer" 
misc_feature 1. .4105 

/note="endothelin receptor type a (EDNRA) gene." 

ORIGIN 



Query Match 100.0%; Score 4105; DB 6; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 



Qy 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGT^GGTCTGGAGCTTTGGGAGG 


60 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 i 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 


Qy 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 M 1 1 1 1 




Db 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 


Qy 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 


Qy 


181 


A nn r* 7\ rp /-* A r* r* r" n r* r* r* r* a r* ^ 


240 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 


Qy 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 M 1 1 1 




Db 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 


Qy 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 i 1 M 1 M 1 1 1 1 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 


Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGA7\7\A 


420 


Qy 


421 


A7W\AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 N 1 1 1 1 1 1 1 1 1 1 




Db 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 


Qy 


481 


CAAGATGG7WVCCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 N M 1 1 1 1 1 1 1 1 




Db 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 


Qy 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 



541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 



Qy 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

Qy 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M M I M 

Db 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTTW^TTACTTCAGCTTT 72 0 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

Qy 781 TyVCTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

Qy 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I 
Db 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I [ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 12 00 

Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I I I I I I I I I I I I I I I I M I I M I M I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I 
Db 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I 
Db 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 138 0 

Qy 1381 GCAGCGTCGAGAAGTGGCTU^AAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 4 0 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I 
Db 1381 GCAGCGTCGAGTy^GTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 



Qy 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I II I I I I I I I I I I I I II I I I I I I I I I I I 

Db 14 41 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAG7\A 1500 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCTUVC 1560 

I I I M I II I I I I I I II I I I I I I I I I I I I I M I I I I I I I II I I I I I I II I I I I I I I I I I I I 
Db 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGA7VATTTAAAAATTG 1620 

I I I I M I I I I I M I M I I I I I II I I I I I I M I I I I I I I I I I I I II I I M I I I II I I I I II 

Db 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTT7\AAAATTG 162 0 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAi^AGTCTGATGACCTCGGTCCC 168 0 

I M I I II I I II I I I II I II I I I I II I I M I I I I M M I I I I I I I I II I I I I II I I II I I I 
Db 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

Qy 1681 CATGAACGGAACAAGCATCCAGTGG7VAGAACCACGATCAAAACAACCACAACACAGACCG 174 0 

M I I I I I I I I I I I I II I I I II I I I I I M II II I I I II I II I I I II I II I I I I M I I I I I I 
Db 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAT^CAACCACAACACAGACCG 174 0 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

I I I I II I M I I II II II II I I I I I I I I I I I I I M I I II I I I II I II I II I I II I II I II I 
Db 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

Qy 18 01 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 

M II I I II II I I I I I I I I I I II II I II I I I I I I I I I I I II II II I I I I II I I I I I M I II 

Db 18 01 AATCCTCTCGGAG7\AAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

I I I I I II II I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II I 

Db 18 61 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGA7\ATGCTTTCCAAAACCGCAAGGTAGA 192 0 

Qy 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCT7\ATTTACATA 1980 

II I M I I I I I I I I I I I II II I I I II I I I I I I II I I I I I II II II I I I I I I I I I I I I II I I 

Db 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 198 0 

Qy 1981 TTCTGCGTGTTGTATTCAGCACTA7Wy\ATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2040 

I M I I I I I I II I I I I II I I I I I I I I M I I I I II M I M I II II I I I I II I I I I I I I M II 
Db 1981 TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 204 0 

Qy 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I I I I II I I I I I M II I I I I II II I I I I M II I I I I I I II I I I I II I I I II I I I I II I I 

Db 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAA7VATAGAGCTTTCAAGTACATGG 2100 

Qy 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAT^CTTTAG 2160 

II I I II II I I I I II M I I M I I I I I I M I I I II I I I I II I I I I I M I II I I I II I I I I I I 

Db 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

Qy 2161 AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 222 0 

I I I II I I I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I M I M I I I I I II I II II I I I 
Db 2161 AGATT7\ACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

Qy 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 8 0 

I I I I I I I I I I I I M I I M I I I I I I I I I M I I II I I I I I I M I M I II I II I I M I I I I I I 

Db 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 2280 



Qy 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAA7iAAAA7\AAGACAAA 2340 

M I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 2340 

Qy 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 2400 

I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 2400 

Qy 24 01 ACACTW^TTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 01 ACAC7WVTTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

Qy 2461 TTTGGCAGTTT7\ATAGATGTTACTCAAAGAATTTTTT7VAG7\ACTGTATTTTATTTTTTAA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

Qy 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I 

Db 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

Qy 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

I I M I I I I I I I I I I i I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

Qy 2641 AAAATCAATGTCAAGTACCTWUVTGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I 

Db 2 641 AAAATCAATGTCAAGTACC7\A7\ATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

Qy 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 2760 

I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 27 01 TCAGTGCACTGTATATAGTyVGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 2760 

Qy 27 61 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I U I I I I I I M I I I I I I I I 

Db 27 61 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 282 0 

Qy 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 288 0 

I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I Ml I I I I I I I I M I I I I I I 

Db 2821 CACCTCCTATTCTCTTAATTTTTGTTA7\7\ATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 80 

Qy 2 8 81 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

Qy 2 941 GTWWVTAATTACCCACT^AATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 GTUUWVTAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 



Qy 



3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 



Db 


3121 




3181 


Db 


3181 


wy 


3241 


Db 


3241 


yy 


3301 


Db 


3301 


r\\T 
'^Y 


o o u X 


Db 


3361 




3421 


Db 


3421 


yy 


O H O X 


Db 


3481 


vy 


3541 


Db 


3541 


wy 


3601 


Db 


3601 


yy 


3661 


Db 


3661 


vy 


3721 


Db 


3721 


wy 


3781 


Db 


3781 


Ov 
vy 


3841 


Db 


3841 


Qy 


3901 


Db 


3901 


Qy 


3961 



I I M 11 I I I I I I I I M I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I 
AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 4 0 

I I I M I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I M I I I I N 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

GGTATGTATGGATTTAATCTT^TCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

GTCTGAGCT7WUVTCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I M I I I I I I I I I I I I I I I I M I I I I I M I M I I I I I I I I I I I I I I I N I I I I I I I I I I I 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

TGTAGCAACCTTCTGCATTCATA7VATCTTGTAATCATGTTACCATTACAAATGGGATATA 342 0 

I I I I I I I I I M I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 342 0 

AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I 

AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I I I I I I I I I I I I I I I I M I I I M I I I I M I I I I I I I I I M I I I M I I M I I I I I I I I I I I 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGAT7\ATAAATTAGGTAAGATA 3660 

I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I M I M I I I I 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

ATTTGTTGGGCCATATTTTAGGACAGGTAATVATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M M M I I I I I I M I I t I I I I I I M I I I I 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

CTVAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTC7WVTCTATTATTCCACTGGCG 37 8 0 

CATCATATGCAGTGATATATGCCTATAATAT7VAGCCATAGGTTCACACCATTTTGTTTAG 3840 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGA7\7\AAAATGCATTTTATAA 3900 

I I I M I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I M 

AC7\ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I M I I I I 
ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 



I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 



Db 



3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 



Qy 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I 

Db 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

Qy 4081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I M I I I I I I I I 
Db 4 081 TAA7VATAAAAGTTTACAGAAACCTT 4105 



RESULT 5 

HSETIR 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
MEDLINE 
PUBMED 
FEATURES 

source 



CDS 



HSETIR 4105 bp mRNA 

H. sapiens mRNA for endothelin-1 receptor 
X61950 

GI :288312 

receptor, 
(human) 



ORIGIN 



linear PRI 23-M7U^-1993 



Craniata ; Vertebrata ; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 



Mukoyama,M. 



X61950.1 
endothelin-1 
Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 4105) 

Hosoda^K., Nakao.K., Hiroshi-Arai , Suga,S., Ogawa,Y 
Shirakami,G. , Saito,Y,, Nakanishi^S. and Imura.H. 
Cloning and expression of human endothelin-1 receptor cDNA 
FEES Lett. 287 (1-2), 23-26 (1991) 
91348221 
1652463 

Location/Qualif iers 
1. .4105 

/organism="Homo sapiens" 

/mol_type-"mRNA" 

/db_xref-"taxon: 9606" 

485. .1768 

/ codon_start=l 

/product- "endothelin-1 receptor" 
/protein_id="CAA43953, 1" 
/db_xref-"GI: 288313" 
/db_xref="GOA: P25101" 
/db__xref="SWISS-PROT: P25101" 

/translation="METLCLRASFWLALVGCVISDNPERYSTNLSNHVDDFTTFRGTE 
LSFLVTTHQPTNLVLPSNGSMHNYCPQQTKITSAFKYINTVISCTIFIVGMVGNATLL 
RIIYQNKCMRNGPNALIASLALGDLIYWIDLPINVFKLLAGRWPFDHNDFGVFLCKL 
FPFLQKSSVGITVLNLCALSVDRYRAVASWSRVQGIGIPLVTAIEIVSIWILSFILAI 
PEAIGFVMVPFEYRGEQHKTCMLNATSKFMEFYQDVKDWWLFGFYFCMPLVCTAIFYT 
LMTCEMLNRRNGSLRIALSEHLKQRREVAKTVFCLWIFALCWFPLHLSRILKKTVYN 
EMDKNRCELLSFLLLMDYIGINLATMNSCINPIALYFVSKKFKNCFQSCLCCCCYQSK 
SLMTSVPMNGTSIQWKNHDQNNHNTDRSSHKDSMN" 



Query Match 100.0%; Score 4105; DB 9; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative . 0; Mismatches 0; Indels 0; Gaps 



0; 



Qy 



1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I M M 



Db 1 G7UVTTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

Qy 61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I M I I M M I I I I I I I I I I I I I I II I M 

Db 61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

Qy 121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

I II I I M I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I 

Db 121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

Qy 181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 240 

I I I I I I II I I I I I I M I I I I I I II I II I I I II I I I I I I II I I I II I I II I I I I I I I I M I 
Db 181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

Qy 241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGG7\AGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I M II I I I I I I I I I I I I I I M II I II I I I I I I I II I I I I I II I I II I I I I I I II I II I I I 

Db 241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

Qy 301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

II I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

Qy 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 42 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 42 0 

Qy 421 A7W\AGTGAAGGTGTAAAAGCAGCAC7\AGTGCAATAAGAGATATTTCCTCAAATTTGCCT 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 48 0 

Qy 481 C7\AGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 CT^GATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

Qy 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

Qy 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCTyVCCCACTAATTTGGTCCT 660 

Qy 661 ACCCAGCAATGGCTC7VATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 72 0 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 78 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

Qy 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II I I I I II I I I 

Db 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 



Qv 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 


Db 


901 


M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 Ml 1 1 1 1 1 1 1 1 1 1 N 1 
TAAGCTGCTGGCTGGGCGCTGGCCTi i i GArCACAArGACTTTGGCGi Ai 1 K^i i 


o u 


Qy 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 




1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACC i u i bObC 1 u 1 




Qv 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGG7VATTGGGATTCC 


1080 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAAi IGGCjAI iCC 


1 n Q n 
1 U Cf u 


Qv 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


T n /I 
114 U 


Qv 


1141 


TG7\AGCGATTGGCTTCGTCATGGTACCCTTTG7y^TATAGGGGTGAACAGCATAAAACCTG 


1200 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


T GAAGCGAT TGGCTTCGT CAT GGT ACC CTT T GAAT AT AG GGGT GAAC AGCATAAAAC CT G 


T o n n 
IzUU 


Qv 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1201 


TAT GCT GAAT GCC ACAT CAAAAT T CAT GGAGT T CT AC CAAGAT GTAAAGGACT G GT GGCT 


1 o c n 
1^ bU 


Qv 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


-1 o O n 

loz U 


Ov 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


T T GT GAGAT GT T GAAC AGAAG GAAT GGC AG CT T GAGTVAT T GCC CT C AGT GAAC AT CT T AA 




Ov 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 




1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


GCAGCGTCGAGAAGTGGCAAAT^CAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


T /I /I n 
14 4 U 


Qy 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 


1500 




1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


GT T C C CT CT T C ACTT AAGC CGT AT AT T GAAGAAAACT GT GT ATAAC GAAAT GGAC7\AGAA 


T c rv n 


Qy 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 




1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 




Db 


1501 


C C GAT GTGAATT ACTT AGT TT CTT ACT GCT CAT GGATT ACAT C GGT ATT AACTT GGCAAC 


1 ^^n 

IDDU 


Qy 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1620 




1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1561 


CATGAATTCATGTATAAACCCCAi AGCi Ci bi Ai i i i bl CjAijUAALj/iAAi 1 i/\AA/\/\l 1 b 


J. D ji. 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGi L- i bAi CjAL-C 1 CCjCjI CL-U 


± o O U 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 


Qy 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1740 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1740 



Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M 

Db 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

Qy 18 01 AATCCTCTCGGAG7WUW\ATCACAAGGCAACTGTGACTCCGGG?ATCTCTTCTCTGATC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M 
Db 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGT^GAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

Qy 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 CTGGTTTATCCACCCACT^CATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

Qy 1981 TTCTGCGTGTTGTATTCAGCACTA7\7\AAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2 040 

Qy 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I M I I I I I M i I I I I I 

Db 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

Qy 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

Qy 2161 AGATTAACGACAAGATTTTCTACTTTTTTT7\AGTGATTTTTTGTCCTTCAGCC7\AACACA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 2161 AGATTi\ACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

Qy 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 80 

Qy 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 2340 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I 
Db 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 2340 

Qy 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

Qy 2401 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 2460 

M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 2401 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

Qy 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

Qy 2521 ATGGTGTTTTATTACAAGGGACCTTGT^CATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I 
Db 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 258 0 



Qy 



2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2540 



Qy 


2641 


AAAAT CAAT GT C7\AGT AC CT^AAAT GTT AAT GT AT GT GT CAT T TAACT CT GCC T GAG ACT T 


o T n n 

z / uu 




ttllllAlllllllltllltlltlllllllllllllllltlllllllllltllllllllt 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M M 1 1 1 1 1 1 1 




Db 


2641 


AAAATCAATGTCAAGTACCAATU^TGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 


2700 


Qy 


2701 


TCAGTGCACTGTATATAGAAGTCTAATVACACACCTAAGAGAAAAAGATCGAATTTTTCAG 


Z 1 bU 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


2701 


TCAGTGCACTGTATATAGAAGTCTATW^CACACCTAAGAGAAAAAGATCGAATTTTTCAG 


2760 


Qy 


2761 


ATGATTCGGATVATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 


o o o n 
Zo2U 




1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


2761 


ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 


2820 


Qy 


2821 


CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 


2880 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2821 


CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTTUi^GTCTTTTTTGATCA 


2880 


Qy 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 


2940 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGTyVGTGGCCAGATGAGTTTATCATGTCAGT 


2940 


Qy 


2941 


GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 


3000 




1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


2941 


GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 


3000 


Qy 


3001 


TCAGTATGAACCTAACTCCCCACCCC7\ACATCTCCCTCCCACATTGTCACCATTTCAAAG 


3060 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


3001 


TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 


3060 


Qy 


3061 


GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 


3120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


3061 


GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 


3120 


Qy 


3121 


AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 


3180 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 




Db 


3121 


AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAAC7\ATTGT7^AATTTCTTTTAGCCC 


3180 


Qy 


3181 


ATT T T T CT AGACT GT CT CT GT GGAAT AT AT TT GT GT GT GTGAT AT AT GC AT GT GT GT GAT 


3240 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M i i 1 1 1 M 1 1 1 




Db 


3181 


ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 


3240 


Qy 


3241 


GGT AT GT AT GGAT TT AAT CT AAT CTAATAAT T GT G C C C C GC AGTT GT GC CAAAGT G CAT A 


o o n n 




,. latlltllllllllllllllllllllllllllllllllltlllllllllllll 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3241 


GGTATGTATGGATTTAATCTAATCTTUVTTyVTTGTGCCCCGCAGTTGTGCCAAAGTGCATA 


3300 


Qy 


3301 


GT CT GAG CTA7WVT CT AGGT GAT T GT T CAT CAT G ACAAC CT GC CT CAGT C CAT T TT AACC 


Q Q n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M M 1 1 1 1 M 1 M 1 1 1 M i 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


3301 


GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 


3360 


Qy 


3361 


TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 


3420 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3361 


TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 


3420 


Qy 


3421 


AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 


3480 






1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 





Db 



3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 348 0 



Qy 


3481 


Db 


3481 


Qy 


3541 


Db 


3541 


Qy 


3601 


Db 


3601 


Qy 


3661 


Db 


3661 


Qy 


3721 


Db 


3721 


Qy 


3781 


Db 


3781 


Qy 


3841 


Db 


3841 


Qy 


3901 


Db 


3901 


Qy 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

M I I I I I I I M I I I I I I I I I M M I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGC7WUVGTCATTA 354 0 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATG7\AATTGCCAGGT 3600 

I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
CACTTTGTyVGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 
I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M 
TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

ATTTGTTGGGCCATATTTTAGGACAGGTATW^TAACATCAGGTTCCAGTTGCTTGAATTG 3720 

M I I I I I I I I I I I I I I I I I I I I I IN I I I M M I I I I I I I I I I I I I I I I I I I I I I M I I I 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 8 0 

M I I I I I I I I I I I I I I I I I I I I I I M I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 40 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M M I I 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I M M I I I I I I I M I I I I 

ATTCAGATVAGTCATAGATTTCTGTyVGGCGTCAACGTGCATTTTATTTATGGACTGGTTVAG 3960 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 402 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I M I I I I I I I I I I I I I I I I I I I I I I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGTT^CTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 408 0 

TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I M I I I I I I I M I I I M I I I M 

TAAAATAAAAGTTTACAGAAACCTT 4105 



RESULT 6 
BD231376 
LOCUS 

DEFINITION 

ACCESSION 
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KEYWORDS 
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ORGANISM 



4105 bp DNA linear PAT 17-JUL-2003 

assessing cardiovascular status and compositions for use 



BD231376 
Genes for 
thereof . 
BD231376 

BD231376.1 01:33041146 
JP 2002527079-A/140. 
Homo sapiens (human) 
Homo sapiens 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 

COMMENT 



FEATURES 

source 



ORIGIN 



Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 4105) 

Norberg, L. T . , Andersson, M. K . , Lindstrom, P . H . R, and Jonsson,L. 
Genes for assessing cardiovascular status and compositions for use 
thereof 

Patent: JP 2002527079-A 140 27-AUG-2002; 

PAIROSEAKENSINGU AB 

OS Homo sapiens (human) 

PN JP 2002527079-A/140 

PD 27-AUG-2002 

PF 13-OCT-1999 JP 2000576056 

PR 14-OCT-1998 US 50/104286, 14-OCT-1998 US 60/104302 PI 
LEIF TORBJORN NORBERG, MARIA KRISTINA ANDERSSON, PER HARRY PI 
RUTGER LINDSTROM, 
PI LENA JONS SON 

PC C12Ql/68,C12Nl5/09//G01N33/53,G01N33/566,C12N15/00 CC Genes 

for assessing cardiovascular status 

and compositions for 

CC use thereof 

FH Key Location/Qualifiers 
FT source 1. .4105 

FT /organism= * Homo sapiens (human)*. 

Location/Qualifiers 
1. .4105 

/organism="Homo sapiens" 
/mol_type== "genomic DNA" 
/db xref="taxon: 9606" 



Query Match 100.0%; Score 4103; DB 6; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4103; Conservative 0; Mismatches 2; Indels 0; 



Gaps 



0; 



Qy 

Db 



1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I 

1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 240 

I I I I I I I I I I I I I M I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

241 GCAGTGCCCAGG7\AGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I 
241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 



Qy 



Db 



301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I 
301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 



Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACbbiCjAAAA 


4 9 0 
H U 


Qy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


7y\AAAGTGAAGGTGTAAAAGCAGCACAAGTGCAArAAGAGAi Ai 1 rCL-iUAAAl 1 ibUUi 


4 ft n 

^ 0 u 


Qy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTIGGAI Gi GlAAi 


^ /I n 
0 4 u 


Qy 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCT7\AGCAATCATGTGGATGATTTCACCAC 


600 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 




Db 


541 


CAGT GATAAT OCT GAGAGAT AC AGC ACAAAT CT AAG CAAT CAT GT GGAT GAT T T CAC C AC 


bU U 


Qy 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


£Z r\ 
bbU 


Qy 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


661 


ACC CAG CAATG GCT CAATGC ACAACT AT T GC C C AC AGCAGACT AAAAT T AC TT CAGCTT T 


ion 
/ z U 


Qv 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


721 


CAAAT ACATTAACACT GTGAT AT CTTGT ACTATTTTCAT CGT GGGAAT GGT GGGGAAT GC 


T Q n 
/ o U 


Qv 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


AACT C T G CT CAGGAT CATT T AC CAGAACAAAT GT AT GAGGAAT GGC C C CAACGC GCT GAT 


o 4 U 


Qv 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




1 1 1 1 1 1 1 1 M 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


841 


AGC C AGT CT TGC C CT T GGAGAC CT T AT CT AT GT GGT CAT T GAT CT C C CT AT CAAT GT AT T 


Q n n 
y u u 


Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCTVA 


Q tf^ n 


Qy 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGi uCi OAACU i Ci (jt^bu i O i 


1 n 9 n 


Qy 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


1080 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCC i GGAGi CGI Gi i CAGGGAAi 1 CatatjAl 1 


1 n ft n 

X U o VJ 


Qy 


1081 


m mm ^ y^ m Ti TV m y y-< n mm ^ TV TV TV mm /"^m /"I m /~* /~i TV m /^m /** TV m /~*m /"TTi ^ /"•rprnTi tv rp f~* rp r^f^(~* A rn rp /~< /~< 

TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGi CCi i iAiUv^lti(jUU/\i luu 


114 0 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 M 1 1 1 M 




Db 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 


Qy 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 


1200 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAT^CtTG 


1200 



Qy 


1201 


TAT GCT CAAT GC CAC AT CAAAA 1 T CAT G GAG i 1 C i AL GAAGAT G 1 AAAGvj/\u n^Ljiu^a^^i 


1 9 (=in 

±Z D U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 




Db 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 


Qy 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACAGGuI UAl (jAU 


1 9 n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 


Qy 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAAL-Ai (^i lAA 


1 ^ ft n 
± o o u 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1321 


TTGTGAGATGTTGAACAGTVANNTVATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 


Qy 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


Xft 4 U 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 




Db 


1381 


GCAGCGTCGAGAAGTGGC7\AAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 


Qy 


1441 


GTT CCCT CTTCACTTAAGCCGT ATATT GAAGAAAACT GT GTATAACGAAAT GGACAAGAA 


± D u u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1441 


GTTCCCTCTTCACTT/AGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAG7\A 


1500 


Qy 


1501 


C CGAT GT GAAT T ACT TAGT TT CT TACT GCT CAT GGATT ACAT C GGT AT T AACT T G GCAAC 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 


Qy 


1561 


CAT GAAT T C ATGT ATAAACC C C AT AG CT CT GT AT TT T GT GAGCAAGAAAT T TAAAAAT T G 


1 dz u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 1 1 




Db 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAATVATTG 


1620 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1 Q n 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 




Db 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAA/yVGTCTGATGACCTCGGTCCC 


1680 


Qy 


1681 


CAT G AAC G G AAC AAG CAT C C AGT G G AAGAAC CAC GAT C AAAAC AAC C AC AAC AC AG AC C G 


1 / 4 U 






1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 




Db 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACT^CCACAACACAGACCG 


1740 


Qy 


1741 


GAGCAG C C ATAAGGACAGC AT GAACT GAC CAC C CTT AGAAGC ACTC CT C G GT ACT C C CAT 


1 Q n n 
1 o U U 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 


Qy 


1801 


AAT C CT CT C GGAGAAAAAAAT CACAAGGCAACT GT GACT C C G G GAAT CT CT T CT CT GAT C 


1 Q n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 


Qy 


1861 


C T T C T T C C T T AAT T C AC T C C C AC AC C C AAGAAGAAAT G C T T T C C AAAAC C b C AA(j i A(j A 


1 Q 9 n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 




Db 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1920 


Qy 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTl lAAi iCzrAiCiAAx i iAUAlA 


1 Q p n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 


Qy 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 


Qy 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCTiAGTACATGG 


2100 



Db 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

Qy 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

Qy 2161 AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 AGATTTVACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 222 0 

Qy 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 2280 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 8 0 

Qy 22 81 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAA7\AGACAAA 234 0 

I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 81 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAA7\7\AAGACAAA 234 0 

Qy 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I I I I I I I I I I I I I I I I I M I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

Qy 24 01 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

Qy 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 TTTGGCAGTTTAATAGATGTTACTC7\AAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

Qy 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2 580 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

Qy 2581 TTCAATCAGATAGTTCTTTTTCAC7\AGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I 

Db 2581 TTCAATCAGATAGTTCTTTTTCAC7\AGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

Qy 2641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I M I I I I I 

Db 2 641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

Qy 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCT7\AGAGAAAAAGATCGAATTTTTCAG 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 

Db 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

Qy 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M M I 

Db 2761 ATGATTCGGA7\ATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 282 0 

Qy 2821 CACCTCCTATTCTCTTAATTTTTGTTATWVTGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 2821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 80 



Qy 



2881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



2 881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 



Qy 2941 GAAAAATAATTACCCACAAATGCCACCAGT7\ACTT7^CGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I M I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 2941 GAAAAATAATTACCCACAAATGCCACCAGTTyVCTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 3001 TCAGTATGAACCT7\ACTCCCCACCCC7^CATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I M I I I I I 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

Qy 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTA/yVTTTCTTTTAGCCC 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M 
Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 40 

Qy 3241 GGTATGTATGGATTTAATCTAATCT7\ATAATTGTGCCCCGCAGTTGTGCCA7VAGTGCATA 33 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

Qy 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGAC7\ACCTGCCTCAGTCCATTTTAACC 3360 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I i I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGT7\ATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

Qy 3421 AGAGGCAGCGTG7U\AGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

Qy 34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAA7\AGTCATTA 3540 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTC7\ATTCAATGTGGTGATGAAATTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGAT7WVTAAATTAGGTAAGATA 3660 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

Qy 3721 CAAGGCT7VAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I M I I M I I I I I M I n I I I I I 

Db 3721 C7\AGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 



Qy 3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I M I N M I I I 

Db 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 4 0 

Qy 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

I I I M I I I I I I I I I I I I I I I M M I I I I I I II I M II I M I I I I I I I I I I M I I I M I M 

Db 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATG7U\AAAAATGCATTTTATAA 3900 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCTW^CGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I M II II I I II I I I I I I I I I I II I I I II I I I II I I I I II I I I I II I I I I II I 

Db 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

Qy 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCTiACA 4020 

I II II I II I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 3961 T7VACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

Qy 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 

I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II M I 
Db 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

Qy 4 081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 081 TAAAATAAT^GTTTACAGAAACCTT 4105 
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S57498 4105 bp mRNA linear 

endothelin ET-A receptor [human, mRNA, 4105 nt] . 
S57498 

S57498.1 GI:298319 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 4105) 

Arai,H., Nakao^K., Hosoda,K., Ogawa,Y., Nakagawa^O., Komatsu,Y. and 
Imura, H. 

Molecular cloning of human endothelin receptors and their 

expression in vascular endothelial cells and smooth muscle cells 

Jpn. Circ. J. 56 Suppl 5, 1303-1307 (1992) 

93180293 

1291713 

GenBank staff at the National Library of Medicine created this 
entry [NCBI gibbsq 128422] from the original journal article. 
This sequence comes from Fig. 5. 

Location/Qualifiers 

1. .4105 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref-"taxon: 9606" 
485. .1768 

/note="This sequence comes from Fig. 5; conceptual 
translation presented here differs from translation in 
publication; ET-AR" 



/codon_start=l 

/product="endothelin ET-A receptor" 
/protein_id="AAB25530 . 2 " 
/db_xref="GI: 18390352" 

/translation="METLCLRASFWLALVGCVISDNPERYSTNLSNHVDDFTTFRGTE 
LSFLVTTHQPTNLVLPSNGSMHNYCPQQTKITSAFKYINTVISCTIFIVGMVGNATLL 
RIIYQNKCMRNGPNALIASLALGDLIYWIDLPINVFKLLAGRWPFDHNDFGVFLCKL 
FPFLQKSSVGITVLNLCALSVDRYRAVASWSRVQGIGIPLVTAIEIVSIWILSFILAI 
PEAIGFVMVPFEYRGEQHKTCMLNATSKFMEFYQDVKDWWLFGFYFCMPLVCTAIFYT 
LMTCEMLNRXNGSLRIALSEHLKQRREVAKTVFCLWIFALCWFPLHLSRILKKTVYN 
EMDKNRCELLSFLLLMDYIGINLATMNSCINPIALYFVSKKFKNCFQSCLCCCCYQSK 
S LMT S VPMN GT S I QWKNH DQNNHNT DRSSHKDSMN" 

ORIGIN 



Query Match 100.0%; Score 4103; DB 9; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4103; Conservative 0; Mismatches 2; Indels 0; Gaps 



Qy 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 




Db 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 


Qy 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 




Db 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 


Qy 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 


Qy 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 




hiii»tittiiiiiiiiiiiiiiiiiiiiillllllllllllllllllllll[| 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 1 




Db 


181 


CAT C CAT C C CACC C G GT C GT C GC C GGGGAT T GG GGT C C C AGC GACAC CT C CC CGGGAGAA 


Z ft u 


Qy 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 


Qy 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml 1 1 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 


Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 


Qy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATi^AGAGATATTTCCTCAAATTTGCCT 


480 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 


Qy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 


Qy 


541 


CAGTGATAATCCTGAGAGATACAGCACTW^TCTAAGCAATCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 



Ov 


601 


Db 


601 


Ov 


661 


Db 


661 


Ov 


721 


Db 


721 


Ov 


781 


Db 


781 


Ov 


841 


Db 


841 


Ov 


901 


Db 


901 


Ov 
s^y 


961 


Db 


961 


Ov 
V!y 


1021 


Db 


1021 


Ov 

v£y 


1081 


Db 


1081 


Ov 
vy 


1141 


Db 


1141 


Ov 


1201 


Db 


1201 


Qv 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 



TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I I I I I I I I M I I I I I 11 I I I I I I I I IN I I I I M I I I I I I I I I I I I I I I I I I I I I I 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAA7UVTTACTTCAGCTTT 720 

I I I I I I I I I I I I I I I I I M M I I M I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I 

7\ACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M 

AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 

TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M i I I I I I I I I I I I I I I I M I I I I I 

GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 10 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I M I I I I I 

TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTG7\ACAGCATAAAACCTG 12 00 

TATGCTCAATGCCACATCAA7\ATTCATGGAGTTCTACCAAGATGT7WVGGACTGGTGGCT 1260 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I M 

TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCTVAGATGTAAAGGACTGGTGGCT 12 60 

CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I 

CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTGTGAGATGTTGAACAGAANNAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 138 0 

GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 144 0 

I I I I I 11 I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I 
GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 144 0 



Qy 


1441 


y^mm m r-^ m m -n y^m m -n. -n r-^ m 7\ tTl 7\ rp ITl 7\ TV 7\ TV TV TV rlH /^m "TV m TV 7\ TV T\ T\ fTl TV T\ 7\ TV 7\ 

GTT C C CTCT T CACT T AA.GC C GT AT AT T GAAGAAAACT GT GT AT7VAC GAAATGGACAAbAA 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 


1500 


Qy 


1501 


y-^ -n m >^ m tl ti m m -r\ mm "fv >^ m m m m m TV m m TV m 7\ rp rn TV TV m m TV m rn t\ tv rp rn TV TV 

CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGAi i ACATCGGTATl AACi iGGL-AAU 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 


Qy 


1561 


CAT GAATT CAT GT AT AAAC C C CAT AGCT CT GT AT T TT GT GAGC7\AGAAAT HUPJ^J'sPJ^ T G 


1 t^o n 
1 u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1620 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 






1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCC7\AAAGTCTGATGACCTCGGTCCC 


1680 


Qy 


1681 


CAT GAACGGAACAAGCAT CCAGT GGAAGAACCAC GAT CAAAACAACCACAACACAGACCG 


1 / 4 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 




Db 


1681 


CATGAACGG7UVC7VAGCATCCAGTGGAAGAACCACGATC7\7WVCAACCACAACACAGACCG 


1740 


Qy 


1741 


GAGC AG CCATAAG GACAGC AT GAACTGAC CAC CCTT AGAAG CACT C CT C GGT ACT C C CAT 


T o n n 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 


Qy 


1801 


AAT C CT CT C GGAGAAAAAAAT C ACAAGG CAACT GT GACT C C GG GAAT CTCTTCTCT GAT C 


1 Q £r n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 




Db 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 


Qy 


1861 


CTT CTT C CT T AAT T CACT C CCACAC C CAAGAAGAAAT G CT T T C CAAAAC C GCAAG GTAGA 


1 Q o n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1920 


Qy 


1921 


CT G GT T TAT CCAC CC ACAACAT CT AC GAAT C GT ACT T CTT T AAT TGAT CTAAT T T ACAT A 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 


Qy 


1981 


TT CT GC GT GTT GT AT T CAGC ACT7VAAAAAT GGT GGGAGCT GGGG GAGAAT GAAGACT GT T 


o n /I n 
Z U 4 U 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 


Qy 


2041 


AAAT GAAAC C AGAAGGAT AT T TACT ACT T T T GCAT GAAAAT AGAGCT T T CAAGT AC ATGG 


z 1 UU 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 


2100 


Qy 


2101 


m J m m mm tv m /-^ -m y^m m m m 7\ TV m /~* m m TV TV m T\ TV m m TV TV iTt TV TV 7\ rn rp rp TV 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACl GGI CACCAl GAAAUi 1 i/YU 


Z 1 D u 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 i M 1 1 1 1 1 1 




Db 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 


2160 


Qy 


2161 


t\ TN m m t\ -n >^ -i\ t\ t* -t\ m m m m A> m tv rp m rp rprn rp rp TV Tv rp TV rp rp rp rpm rp /~* rp rp rp Ti TV 7\ TV TV T\ 

AGATTAACGACAAGATTTTCTACTTTTTi 1 AAGi GAi i i i i i G J. CUi 1 


9 9 9 0 
ZZ Z U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 


2220 


Qy 


2221 


ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTi^ACTGCA 


2280 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2221 


ATATGGGCTCAGGTCACTTTTATTTGTWVTGTCATTTGGTGCCAGTATTTTTTTUVCTGCA 


2280 


Qy 


2281 


TT^ATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 


2340 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAT^ 2340 

Qy 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I M M I I I I I I I I I I I 

Db 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

Qy 2401 ACACAAATTCT7\AAGCTACAACAAATACTACAGGCCCTTA7\AGCACAGTCTGATGACACA 2460 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

Qy 2461 TTTGGCAGTTT7\ATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I 
Db 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 252 0 

Qy 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTT^TGC 258 0 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I 
Db 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

Qy 2581 TTC7\ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I 

Db 2581 TTC7\ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

Qy 2 641 AAAATCAATGTCAAGTACCTWUVTGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I M I I I I I I 
Db 2641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

Qy 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAA7VAGATCGAATTTTTCAG 2760 

Qy 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

Qy 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 288 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I M I I i I I I I I I I I I I I I I I 

Db 2821 CACCTCCTATTCTCTTi\ATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 80 

Qy 2881 TTCCCTTTTCCATATAGGAAACATAATTTTGT^GTGGCCAGATGAGTTTATCATGTCAGT 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 2 8 81 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

Qy 2941 GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 2941 GA7W\ATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTTyVCTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I M I I I I I I I I I M I I I M I I I I I I I I I I M M I I I I I I I I I I M I I I I I I I 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 



Qy 



3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 
M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I M I I I 



Db 



3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 



Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

Qy 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 GGTATGTATGGATTT7UVTCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

Qy 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 3301 GTCTGAGCTTVAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGT7\ATCATGTTACCATTACAAATGGGATATA 3420 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 3480 

I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I 
Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 348 0 

Qy 34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAT^TTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGATUVTTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATA7\ATTAGGTAAGATA 3660 

I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I 
Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATA7\ATTAGGTAAGATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAi\AT7^CATCAGGTTCCAGTTGCTTGj^ATTG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAAT7\ACATCAGGTTCCAGTTGCTTGAATTG 3720 

Qy 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

Qy 3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

Qy 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M 
Db 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

Qy 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 



Qy 4021 AGTAACTTTGTAGAAATGAGCCAG7UVGCC7\AGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 4021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 0 80 

Qy 4 081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I M I I I I I I I I I I I I I I I 

Db 4081 TAAAATAAAAGTTTACAGAAACCTT 4105 
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Qy 5 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 64 

I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 60 

Qy 65 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 124 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 120 

Qy 12 5 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 184 

I I I I I I I I I M I I I I I I I I M I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 121 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 18 0 

Qy 185 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAG 244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAG 240 

Qy 24 5 TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I 
Db 241 TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 300 

Qy 305 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 364 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 301 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 360 

Qy 365 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAA 424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 361 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAATW^ 42 0 

Qy 425 AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 484 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 421 AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 4 80 

Qy 485 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I t I I I M I 
Db 481 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 54 0 

Qy 54 5 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 604 

I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GATAATCCTGAGAGATACAGCACAT^TCTAAGCAATCATGTGGATGATTTCACCACTTTT 600 

Qy 605 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 601 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 660 

Qy 665 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACT7U\AATTACTTCAGCTTTCAAA 72 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCTWV 720 

Qy 725 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 780 



Qy 785 CTGCTCAGGATCATTTACCAGAACT^TGTATGAGGAATGGCCCCAACGCGCTGATAGCC 844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I 

Db 781 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 84 0 

Qy 845 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATC7\ATGTATTTAAG 904 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I M I I I I I I I I I 
Db 841 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTT^G 900 

Qy 905 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 960 

Qy 965 TTCCCCTTTTTGCAG7\AGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 102 4 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1020 

Qy 1025 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1084 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1080 

Qy 1085 GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M 
Db 1081 GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 114 0 

Qy 1145 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATA7WVCCTGTATG 1204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATA7y\ACCTGTATG 12 00 

Qy 12 05 CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGT7\AAGGACTGGTGGCTCTTC 12 64 

I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 1201 CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 12 60 

Qy 1265 GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1324 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M 

Db 12 61 GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 132 0 

Qy 1325 GAGATGTTG7\ACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 138 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I M I 
Db 1321 GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTT7\AGCAG 1380 

Qy 1385 CGTCGAGAAGTGGCT^AAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 1444 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I M 
Db 1381 CGTCGAGTVAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 144 0 

Qy 144 5 CCTCTTCACTTi\AGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGAC7\AGAACCGA 1504 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I 
Db 14 41 CCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGA 1500 

Qy 1505 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1564 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1560 

Qy 1565 AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTA7\AAATTGTTTC 1624 

I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1561 AATTCATGTAT7^AACCCCATAGCTCTGTATTTTGTGAGCAAGA7y\TTTAAAAATTGTTTC 162 0 



Qy 



1625 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1684 



I I I I I I I I I I I I I I I I M I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1680 

Qy 1685 AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 1744 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M M I 

Db 1681 AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 1740 

Qy 1745 AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATC 18 04 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 1741 AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATC 18 00 

Qy 1805 CTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTTC 1864 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 18 01 CTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTTC 1860 

Qy 1865 TTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTGG 1924 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 
Db 1861 TTCCTT7\ATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTGG 1920 

Qy 1925 TTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCT 1984 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I M I 
Db 1921 TTTATCCACCCACAACATCTACG7VATCGTACTTCTTTAATTGATCTAATTTACATATTCT 1980 

Qy 1985 GCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAAT 2 044 

I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I 
Db 1981 GCGTGTTGTATTCAGCACTAA7U\AATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAAT 2040 

Qy 204 5 G7WVCCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 2104 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 2041 GAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 2100 

Qy 2105 CTTTTATGGCAGTTCTGGTG7\ATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGAT 2164 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2101 CTTTTATGGCAGTTCTGGTGAATGTTCAATGGG7\ACTGGTCACCATGAAACTTTAGAGAT 2160 

Qy 2165 TAACGAC7\AGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 2224 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 TAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 2220 

Qy 2225 GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTT^CTGCATAAT 22 8 4 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I M 
Db 2221 GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 2280 

Qy 2285 AGCCTAACATGATTATTTG7\ACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAATA 2344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 22 81 AGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAA7VAATA 2340 

Qy 2345 GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACAC 2 4 04 

I I M I M I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M M 

Db 2341 GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTA7WVCAC 24 00 

Qy 2405 AAATTCTAAAGCTACAAC7\AATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTTG 2464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 2401 AAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTTG 24 60 



Qy 2465 GCAGTTTAATAGATGTTACTCTW^GAATTTTTTAAGAACTGTATTTTATTTTTTAAATGG 2524 

I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I M I I I I I I I I I I I I I I I M I I I 



Db 



24 61 GCAGTTTAATAGATGTTACTC7WVGAATTTTTTAAGAACTGTATTTTATTTTTTAAATGG 2520 



Qy 2525 TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCA 2584 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 2521 TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTTy^TTCAAAAGTAATGCTTCA 2580 

Qy 2 585 ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAAA 2644 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M M I M I I I I 
Db 2 581 ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAAA 2640 

Qy 2645 TCTVATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 2704 

I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2641 TCAATGTC7\AGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 2700 

Qy 27 05 TGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATGA 2764 

I I I I I I I I I I I I I I M I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 01 TGCACTGTATATAGAAGTCTAAAACACACCTAAGAGA7VAAAGATCGAATTTTTCAGATGA 27 60 

Qy 2765 TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 2824 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 27 61 TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 2820 

Qy 2 825 TCCTATTCTCTTAATTTTTGTTAAAATGTTTVACTGGCAGTAAGTCTTTTTTGATCATTCC 2884 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 2821 TCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTCC 2 880 

Qy 2 885 CTTTTCCATATAGGAAACAT7\ATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTG7\AA 2 944 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 8 81 CTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAAA 2 940 

Qy 2945 AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAG 3004 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAG 3000 

Qy 3005 TATG7\ACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 3064 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 TATG7\ACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 3060 

Qy 3065 CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAAA 3124 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAA/VA 3120 

Qy 3125 TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 3184 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 3121 TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 3180 

Qy 318 5 TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 3244 

M I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3181 TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 3240 

Qy 3245 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3304 

I M M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3241 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3300 

Qy 3305 GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 33 64 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 3301 GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 3360 



Qy 3365 GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 3424 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I 
Db 3361 GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 342 0 

Qy 342 5 GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 8 0 

Qy 34 8 5 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 354 4 

I I I I I I M I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3481 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 354 0 

Qy 354 5 TTGAAGTATTATATTGTTCTTATCCTCTVATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3604 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 TTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3600 

Qy 3605 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGAT7VATTT 3664 

I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3601 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGT7\AGATAATTT 3660 

Qy 3665 GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAG 3724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAG 3720 

Qy 3725 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 3784 

I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I 
Db 3721 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 37 80 

Qy 3785 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 3844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 37 81 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 38 4 0 

Qy 3845 TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTC 3904 

I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I M M I I I I I I I I I I I I I I M I I I I I I I 
Db 3841 TTGTCTTTTTTTC7\AGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTC 3900 

Qy 3905 AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 3964 

I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3901 AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 3960 

Qy 3965 TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 4024 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 3961 TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 402 0 

Qy 4025 ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATT^GTGTAAA 4084 

I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAAA 408 0 

Qy 408 5 ATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I M I M I I I I I I I I 
Db 4081 AT7U\AAGTTTACAGAAACCTT 4101 



RESULT 9 
AR270694 

LOCUS AR270694 4079 bp DNA linear PAT lO-APR-2003 
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KEYWORDS 

SOURCE Unknown. 

ORGANISM Unknown. 
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JOURNAL Patent: US 6500938-A 1257 31-DEC-2002; 
FEATURES Location/Qualifiers 
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/ organism= "unknown" 
/mo l_type= "genomic DNA" 

ORIGIN 

Query Match 99.4%; Score 4079; DB 6; Length 4079; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4079; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 60 

GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 12 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 12 0 

CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 184 
I I I I I I I M I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 18 0 

CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAG 24 4 

I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I M i I I I I I I I I I I M 

CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAG 24 0 

TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 304 

I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M 

TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 300 

GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 364 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 360 

CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAATWW^A 424 

I I I I I M I I I I I M I I I I I I I I M I I I I M I M I I I I I I I I I I M I I I I I I I I I I I I I I I 

CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGATU^AAAAA 42 0 

AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 4 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 480 

ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I M I I I I M 

ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 54 0 
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Qy 54 5 GATAATCCTGAGAGATACAGCACATUVTCTAAGCAATCATGTGGATGATTTCACCACTTTT 604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 600 

Qy 605 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 660 

Qy 665 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 724 

I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 AGCAATGGCTCAATGCACj^ACTATTGCCCACAGCAGACTAATVATTACTTCAGCTTTCAAA 72 0 

Qy 725 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 7 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TACATT7\ACACTGTGATATCTTGTACTATTTTCATCGTGGG7^TGGTGGGGAATGCAACT 780 

Qy 785 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I 
Db 781 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 84 0 

Qy 845 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 904 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 841 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 900 

Qy 905 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 960 

Qy 965 TTCCCCTTTTTGCAGT^GTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1024 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 961 TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1020 

Qy 1025 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1084 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1021 GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1080 

Qy 108 5 GTAACTGCCATTGTWVTTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1144 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I 

Db 1081 GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1140 

Qy 1145 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGTUVCAGCATAAAACCTGTATG 12 04 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1141 GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAA7\ACCTGTATG 12 00 

Qy 1205 CTCAATGCCACATCTW^ATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 1264 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1201 CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 1260 

Qy 1265 GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1324 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1261 GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1320 

Qy 1325 GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 1384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I 

Db 1321 GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTTVAGCAG 1380 

Qy 1385 CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 14 44 



I I I I I I I I M I I I I M I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I M I I I I N I 

Db 1381 CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 1440 

Qy 144 5 CCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGA 1504 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 1441 CCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGA 1500 

Qy 1505 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1564 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1560 

Qy 1565 AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTC 1624 

I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I M I I I I I I I I I I 

Db 1561 AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTC 1620 

Qy 1625 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1684 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I M I I I I I 
Db 1621 CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1680 

Qy 1685 AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 1744 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 1681 AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACT^CCACAACACAGACCGGAGC 174 0 

Qy 1745 AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATC 1804 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATC 1800 

Qy 1805 CTCTCGGAGATWW^TCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTTC 18 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1801 CTCTCGGAGAAAAAAATCACAAGGC7\ACTGTGACTCCGGGAATCTCTTCTCTGATCCTTC 18 60 

Qy 1865 TTCCTTAATTCACTCCCACACCCAAGAAGAT^ATGCTTTCCAAAACCGCAAGGTAGACTGG 1924 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1861 TTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTGG 1920 

Qy 1925 TTTATCCACCCACAACATCTACG7VATCGTACTTCTTTAATTGATCTAATTTACATATTCT 1984 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 

Db 1921 TTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCT 1980 

Qy 1985 GCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAAT 2044 

I I I I I I I I I I I I I I I I I I I M I I I I I I i I I I I I I M I i I I I I I I I I I I I I I I I I I M I I I 
Db 1981 GCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAAT 2040 

Qy 2045 GAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 2104 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 041 GAAACCAGTUVGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCT^GTACATGGCTAG 2100 

Qy 2105 CTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGAT 2164 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGAT 2160 

Qy 2165 TAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 2224 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 TAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 222 0 

Qy 2225 GGGCTCAGGTCACTTTTATTTGAT^TGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 22 84 

I I I I I I I M I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M 



Db 


2221 


GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 


2280 


Qy 


2285 


AGC C T AAC AT GAT TAT T T GAAO i I A i i i ALAU A i Avj ill CjAAAAAAAAAAvjAC/Va/vam. i ±\ 


ii. *1 




1 1 1 1 1 i 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2281 


AGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACA7U\AATA 


2340 


Qy 


2345 


GTATTCAGGTGAGCAATTAGATTAGi Ai ill UCACCjI LALlAi i iAi i 1 1 i i ii\/\A/\L./\^^ 


T. U 1 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


2341 


GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACAC 


2400 


Qy 


2405 


AAAT T CT AAAGCT ACAACAAAT ACT ACAGGC C CT T AAAGC ACAGT CT GAT GAOACA i i i b 


9 4 f^4 




1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2401 


AAATTCTATW^GCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTTG 


2460 


Qy 


2465 


GO AGT T T AAT AGAT GT TAG T CAAAGAAT T T T T T AAGAAC T GT AT T T TAT T T T T T AAAT G G 


9 9 4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2461 


GCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATGG 


2520 


Qy 


2525 


T GTTT T AT T ACAAGG GAG CT TGAACAT GT TT T GT AT GT T7V7\AT T CAAAAGT AAT GOT T CA 


O R Q /I 
Z D Cf 4 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2521 


TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCA 


2580 


Qy 


2585 


AT C AGAT AGTT CTT T TT CACAAGTT C7\AT ACT GT T TT T CAT GTAAAT T T T GT AT GAAAAA 


O /I 
Z o ^ 4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


2581 


ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAAA 


2640 


Qy 


2645 


TCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTT^CTCTGCCTGAGACTTTCAG 


2704 




1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


2641 


TCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 


2700 


Qy 


2705 


T GCACT GT AT AT AGAAGT CTAAAACACAC CTAAGAGAAAAAGAT C GAAT T T TT C AGAT GA 


z / d4 


Db 


2701 


M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

TGCACTGTATATAG7^GTCTAAAACACACCTAAGAG7W\AAGATCGAATTTTTCAGATGA 


2760 


Qy 


2765 


TTCGGAAATTTTCATTCAGGTATTTGTAATAGi GALAi AIAiAi Gi Ai Ai AUAi AlCAUU 


9 ft 9 /I 
Z o Z ^ 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2761 


TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 


2820 


Qy 


2825 


-fi mm *-^m ^mm TV TV mm mmm /^mm t\ tv Tv T\ m /^mTt TV TV /~^TI TV /^Tl TV TV /^Tl Tl Tl Tl rn rp T* TV T* TV T'T*/^ 

TCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTi i i IGAiLAi iCU 


9 Q ft 4 
Z O O 4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2821 


TCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTCC 


2880 


Qy 


2885 


CTTTTCCATATAGGAAACATAATTTTGAAbi GGLGAGAi GAGi i iAi OAi Cji L-Abi bAAA 


9Q4 4 
Z 'i rr 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2881 


CTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAAA 


2940 


Qy 


2945 


n -n m -R TV mm -»v n T\ TV TV m /"« i~* /*< TV /"*/"* TV /"TTI 7\ 7\ /^mm 7v TV 7V mm /"'mm A /~*mni /^TTT* f~* /^T'T'T'T^ (~*T^C* 

AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACl i Gi i GGGGi i i i UAU 


o U U ft 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2941 


AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAG 


3000 


Qy 


3005 


TATG7\ACCTAACTCCCCACCCCAAGAiLiCGGiCCCAGAi iGiUAUUAi i i CAAAtjbb(^^^ 


(^4 

J U D 1 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M M M M 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 M M M 1 1 1 M 1 1 1 1 M 1 




Db 


3001 


TATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 


3060 


Qy 


3065 


CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAA/^ 


3124 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


3061 


CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAT^A 


3120 



Qy 3125 TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 3184 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 TCTTTTACTAGTGTGTGTGTGTATATATATAAAC7\ATTGTAAATTTCTTTTAGCCCATTT 318 0 

Qy 3185 TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 3244 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3181 TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 324 0 

Qy 3245 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 3241 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3300 

Qy 3305 GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 3364 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 3360 

Qy 3365 GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 342 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 342 0 

Qy 3425 GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 84 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 GCAGCGTGTWVGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 8 0 

Qy 34 85 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 354 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 34 81 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 354 0 

Qy 3545 TTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 TTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3600 

Qy 3605 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATT^ATAAATTAGGTAAGATAATTT 3664 

I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I 
Db 3601 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGAT7\AT7\AATTAGGTAAGATAATTT 3660 

Qy 3665 GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAG 3724 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 3661 GTTGGGCCATATTTTAGGACAGGTAA7UVTAACATCAGGTTCCAGTTGCTTGAATTGCAAG 3720 

Qy 3725 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 3784 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 3721 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 378 0 

Qy 3785 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACTVA 3844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 384 0 

Qy 3845 TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTC 3904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTC 3900 

Qy 3905 AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 3964 

I I M I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 3960 



Qy 3965 TGTGGTTTACTAGCAGG7VATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 4024 

I I I I I M I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3961 TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACTUVGTA 4020 

Qy 4025 ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 4083 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 4021 ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 407 9 
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S45956 3305 bp mRNA linear PRI 08-MAY-1993 

endothelin receptor subtype A [human, placenta, mRNA, 3305 nt] . 
S45956 

S45956.1 GI:257375 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 3305) 

Hayzer,D.J., Rose, P.M., Lynch, J. S., Webb,M.L., Kienzle, B . K. , 

Liu, E.G., Bogosian, E, A. , Brinson,E. and Runge,M.S. 

Cloning and expression of a human endothelin receptor: subtype A 

]\m, J. Med, Sci. 304 (4), 231-238 (1992) 

93035452 

1415318 

GenBank staff at the National Library of Medicine created this 
entry [NCBI gibbsq 115436] from the original journal article. 
This sequence comes from Fig. 2. 

Location/Qualif iers 

1. .3305 

/organism="Homo sapiens" 
/mol_type-"mRNA" 
/db_xref="taxon: 9606" 
1. ,3305 

/gene="endothelin receptor subtype A, ET-R[A] " 
222, ,1505 

/gene="endothelin receptor subtype A, ET-R[A] " 
/note="This sequence comes from Fig. 2; ET-R[A]" 
/ codon_start=l 

/product="endothelin receptor subtype A" 
/protein_id="AAB23644 . 1" 
/db_xref="GI: 257376" 

/translation=-"METLCLRASFWLALVGCVISDNPERYSTNLSNHVDDFTTFRGTE 
LSFLVTTHQPTNLVLPSNGSMHNYCPQQTKITSAFKYINTVISCTIFIVGMVGNATLL 
RIIYQNKYMRNGPNALIASLALGDLIYWIDLPINVFKLLAGRWPFDHNDFGVFLCKL 
FPFLQKSSVGITVLNLCALSVDRYRAVASWSRVQGIGIPLVTAIEIVSIWILSFILAI 
PEAIGFVMVPFEYRGEQHKTCMLNATSKFMEFYQDVKDWWLFGFYFCMPLVCTAIFYT 
LMTCEMLNRRNGSLRIALSEHLKQRREVAKTVFCLWIFALCWFPLHLSRILKKTVYN 
EMDKNRCELLSFLLLMDYIGINLATMNSCINPIALYFVSKKFKNCFQSCLCCCCYQSK 
SLMTSVPMNGTSIQWKNHDQNNHNTDRSSHKDSMN" 



ORIGIN 



Query Match 77.5%; Score 3183,2; 

Best Local Similarity 98.9%; Pred. No. 0; 
Matches 3275; Conservative 0; Mismatches 



DB 9; Length 3305; 
27; Indels 8; Gaps 



7; 



Ov 


263 


Db 


1 


Ov 


323 


Db 


61 


Ov 


383 


Db 


121 


Ov 


443 


Db 


180 


Ov 


503 


Db 


240 


Ov 


563 


Db 


300 


Ov 


623 


Db 


360 


Ov 


683 


Db 


420 


Ov 
wy 


743 


Db 


480 


Ov 


803 


Db 


540 


Ov 
siy 


863 


Db 


600 


Ov 


923 


Db 


660 


Qy 


983 


Db 


720 


Qy 


1043 


Db 


780 



AAGCCGGGG7\AGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGAGCCCGGGACACCGGCCAC 322 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I M I I 

AAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGAGCCCGGGACACCGGCCAC 60 

CCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGCCCAGGCGCCGCGCGGACC 382 

I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I 

CCTCCGCGCCACCCACCCTCGCCGGCTCCGGCTTCCTCTGGCCCAGGCGCCGCGCGGACC 120 

CGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTG7WVAAAAAAGTGAAGGTGTAAAAGCA 442 

I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M M I M I I I I I M I I I I I 

CGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTG-AAAAAAAAGTGAAGGTGTATVT^GCA 17 9 

GCACAAGTGCTVATAAGAGATATTTCCTCATUVTTTGCCTCAAGATGGAAACCCTTTGCCTC 502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I 
GCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAGATGGAAACCCTTTGCCTC 239 

AGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGTGATAATCCTGAGAGATAC 562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
AGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGTGATAATCCTGAGAGATAC 299 

AGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTTCGTGGCACAGAGCTCAGC 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTTCGTGGCACAGAGCTCAGC 359 

TTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCCAGCAATGGCTCAATGCAC 682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTCCTGGTNACCACTCATCAACCCACTAATTTGGTCCTACCCAGCAATGGCTCAATGCAC 419 

AACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAATACATTAACACTGTGATA 742 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I 

AACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCTVAATACATTAACACTGTGATA 47 9 

TCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTAC 802 

I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTAC 539 

CAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGAC 862 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I M M I I I I I 

CAGAACAAATATATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGAC 599 

CTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTT7VAGCTGCTGGCTGGGCGCTGG 922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I 

CTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGG 65 9 

CCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAG 982 

I I I I I I I M I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

CCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAG 719 

TCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCA 1042 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I 

TCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCA 779 

GTTGCCTCCTGGAGTCGTGTTCAGGGTiATTGGGATTCCTTTGGTAACTGCCATTGATiATT 1102 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
GTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATT 839 



Qy 1103 GTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATG 1162 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 840 GTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATG 899 

Qy 1163 GTACCCTTTGAATATAGGGGTGAACAGCAT7VA7UVCCTGTATGCTCAATGCCACATCAAAA 1222 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 900 GTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCCACATCAAi\A 959 

Qy 1223 TTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATG 1282 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 960 TTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATG 1019 

Qy 1283 CCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGG 1342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1020 CCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGG 1079 

Qy 1343 AATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCAAAA 1402 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1080 7\ATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCAAAA 1139 

Qy 14 03 ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGT 1462 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 114 0 ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCATTTAAGCCGT 1199 

Qy 1463 ATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGATGTGAATTACTTAGTTTC 1522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1200 ATATTGAAGAAAACTGTGTATAACGAGATGGACAAGAACCGATGTGAATTACTTAGTTTC 1259 

Qy 1523 TTACTGCTCATGGATTACATCGGTATTAACTTGGC7\ACCATGAATTCATGTATAAACCCC 1582 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1260 TTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCC 1319 

Qy 1583 ATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGC 1642 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M 

Db 1320 ATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGC 1379 

Qy 1643 TGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATGAACGGT^CTU^GCATCCAG 1702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1380 TGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATGAACGGAACAAGCATCCAG 1439 

Qy 17 03 TGGTU^GTy^CCACGATCAAAACAACCACAACACAGACCGGAGCAGCCATAAGGACAGCATG 1762 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 144 0 TGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGCAGCCATAAGGACAGCATG 1499 

Qy 1763 AACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAA7y\ATC 1822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1500 7VACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATCCTCTCGGAGAAAAAAATC 1559 

Qy 1823 AC7\AGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCA 18 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1560 ACAAGGCAACTGTGAGTCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAATTCACTCCCA 1619 

Qy 1883 CACCCAAG7\AGAAATGCTTTCCAAAACCGCAA-GGTAGACTGGTTTATCCACCCACAACA 1941 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1620 CACCC7\AGAAGAAATGCTTTCCAAAACCGCAAGGGTAGACTGGTTTATCCACCCACAACA 1679 

Qy 1942 TCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCA 2001 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1680 TCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTTGTATTCAGCA 1739 

Qy 2002 CTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCAGAAGGATATT 2061 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1740 CTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCAGAAGGATATT 17 99 

Qy 2062 TACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTTCTG 2121 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1800 TACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAGCTTTTATGGCAGTCCTG 18 5 9 

Qy 2122 GTGAATGTTCAATGGGAACTGGTCACCATGA7\ACTTTAGAGATTAACGACAAGATTTTCT 2181 

M II I I I I I I I I II I I II I I II II I I I I I I I I I II I I II I I II II I I I II II II I I I II 

Db* 1860 GTGAATGTTCACTGGGAACTGGTCACCATGAAACTTTAGAGATTAACGACAAGATTTTCT 1919 

Qy 2182 ACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACACAATATGGGCTCAGGTCACTTT 224 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1920 ACTTTTTTT7y\GTGATTTTTTTGGCCTTCAGCCAAACACAATATGGGCTCAAGTCACTTT 1979 

Qy 2241 TATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATGATTAT 2300 

I I I I I I I I I I I I II I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1980 TATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAACATGATTAT 2039 

Qy 2301 TTGAACTTATTTACACATAGTTTGAAAAAAAAT^GACAAAAATAGTATTCAGGTGAGCAA 2360 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I II I I I I I I I I I I I II I I I I I 
Db 2 040 TTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAATAGTATTCAGGTGAGCAA 2099 

Qy 2361 TTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACACAAATTCTAAAGCTACA 242 0 

I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2100 TTAGATTAGTATTTTCCACGTCACTGTTTATTTTTTTAAT^CACTyVATTCTAAAGCTACA 2159 

Qy 2421 ACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTTGGCAGTTTAATAGATGT 24 8 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2160 ACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTTGGCAGTTTAATAGATGT 2219 

Qy 24 81 TACTC7\AAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATGGTGTTTTATTACAAGGG 254 0 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 2220 TACTC7\AAGAATTTTTTAAGAACTGTATTTTATTTTTT7\AATGGTGTTTTATTACAAGGG 227 9 

Qy 2541 ACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCAATCAGATAGTTCTTTT 2600 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I M I I I I I M I I I I I I I I I I II 

Db 22 8 0 ACCTTGAACATGTTTTGTATGTTAAATTCTW^GTAATGCTTCAATCAGATAGTTCTTTT 2339 

Qy 2601 TCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAA7WVTCAATGTCAAGTACCA 2660 

II I I II I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 2340 TCACAAGTTCAAT-CTGTTTTTCATGTAAATTTCGTATGAAAAATCAATGTCAAGTACCA 2398 

Qy 2661 AAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAGTGCACTGTATATAGAA 2720 

I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I 
Db 2399 AAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAGAGCACTGTATATAGAA 24 58 

Qy 2721 GTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATGATTCGGAAATTTTCATT 27 8 0 

I I II M I I I I I I M I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I 

Db 2459 GTCTAAAACACACCTAAGAG-A7W\GATCGAATTTTTCAGATGATTCAGAAATTTTCATT 2517 



Qy 



2781 CAGGTATTTGTAATAGTGACATATATATGTATATACATATCACCTCCTATTCTCTTAATT 2840 
I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I II I I I I II I I I M 



Db 2518 CAGGTATTTGGAATAGTGACATATATATGTATATACATATCACCTCCTATTCTCTTAATT 2577 

Qy 2841 TTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTCCCTTTTCCATATAGGAA 2900 

III I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I II I I I I I II II I II II I I I II I I 

Db 257 8 TTTCTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTCCCTTTTCCATATAGGAA 2637 

Qy 2 901 ACATAATTTTG7\AGTGGCCAGATGAGTTTATCATGTCAGTGAAAAATAATTACCCACAAA 2960 

I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I II I I I I I I M I I I I II I I I I I II 

Db 2638 ACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAAAAATAATTACCCACAAA 2697 

Qy 2961 TGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAGTATGAACCTAACTCCC 3020 

I I I II I I II I I M I I I I II I I I I I I I I I I I II I I I II I I I I II II I I I II II I I I 
Db 2698 TGCCACCAG— AACTTACGATTCTTCACTTCTTGGGGTTTTCAGTATGAACCTAACTCCC 2755 

Qy 3021 CACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCCCACAGTGACTTTTGCT 308 0 

I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I 
Db 2756 CACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCCCACAGTGACTTTTGCT 2 815 

Qy 3081 GGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGTU^AATCTTTTACTAGTGTGT 314 0 

I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I M I II I I I I I M I I I I 
Db 2 816 GGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAAATCTTTTACTAGTGTGT 2875 

Qy 3141 GTGTGTATATATATT^AACAATTGTAAATTTCTTTTAGCCCATTTTTCTAGACTGTCTCTG 3200 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 1.1 I I I . 
Db 287 6 GTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTTTTCTAGACTGTCTCTG 2935 

Qy 3201 TGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTATGTATGGATTTAATCT 3260 

I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2936 TGGAATANATATGTGTGTGTGATATATGCATGTGTGTGATGATATGTATGGATTTAANCT 2995 

Qy 32 61 AATCTAATAATTGTGCCCCGCAGTTGTGCCATyVGTGCATAGTCTGAGCTAAAATCTAGGT 332 0 

I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I II Ml I I I I I I I I I I I I I I I I I 
Db 2996 AATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCTGAG-TAAAATCTAGGT 3054 

Qy 3321 GATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTAGCAACCTTCTGCATTC 3380 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Ml I I I I I I I I I I I I I I I I I I 
Db 3055 GATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTAGCAACCTTCTGCATTC 3114 

Qy 3381 ATA7\ATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAGGCAGCGTG7\AAGCAGA 3440 

I I I I I I I I I I I I II II I II I M II I I M I II I I I I II I M I I I I II I I I M I I I I I I I I I 
Db 3115 ATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAGGCAGCGTGAAAGCAGA 3174 

Qy 3441 TGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGTTTGATAAAGCAGTATT 3500 

I I I I I I II I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 317 5 TGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGTTTGAT7\AAGCAGTATT 3234 

Qy 3501 TGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACTTTGAAGTATTATATTG 3560 

I I I II I I I M M I I I I I I I II I I I II I I I I I I I M I M I I I I I I I I I M I I I I I I I I I I 

Db 3235 TGGGGTCATATTGTTNCCTGTGCTGGAGCAAAAGTCATTACACTTTGAAGTATTATATTG 32 94 

Qy 3561 TTCTTATCCT 3570 

II I I I I I I I 

Db 3295 TTCTTAGCCT 3304 
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Homo sapiens endothelin receptor type A, mRNA (cDNA clone MGC: 26548 
IMAGE: 4812050) , complete cds . 
BC022511 
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Series: IRAK Plate: 32 Row: j Column: 7 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 4503464. 

Location/Qualifiers 

1. .2705 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="MGC: 2 654 8 IMAGE: 4812050" 

/tissue_type="Brain, hippocampus" 

/clone_lib="NIH_MGC_95" 

/lab_host-"DH10B" 

/note="Vector : pBluescript" 

1. .2705 

/gene=="EDNRA" 

/note="synonyms: ETA, ETRA" 
/db_xref="LocusID: 1909" 
/db_xref="MIM: 131243" 
351. .1634 
/ codon_start=l 

/product="endothelin receptor type A" 
/protein_id="AAH22511 . 1" 
/db_xref="GI: 18490298" 
/db_xref="LocusID: 1909" 

/translation="METLCLRASFWLALVGCVISDNPERYSTNLSNHVDDFTTFRGTE 
LSFLVTTHQPTNLVLPSNGSMHNYCPQQTKITSAFKYINTVISCTIFIVGMVGNATLL 
RIIYQNKCMRNGHNALIASLALGDLIYWIDLPINVFKLLAGRWPFDHNDFGVFLCKL 
FPFLQKSSVGITVLNLCAliSVDRYRAVASWSRVQGIGIPLVTAIEIVSIWILSFILAI 
PEAIGFVMVPFEYRGEQHKTCMLNATSKFMEFYQDVKDWWLFGFYFCMPLVCTAIFYT 
LMTCEMLNRRNGSLRIALSEHLKQRREVAKTVFCLWIFALCWFPVHLSRILKKTVYN 
EMDKNRCELLSFLLLMDYIGINLATMNSCINPIALYFVSKKFKNCFQSCLCCCCYQSK 
SLMTSVPMNGTSIQWKDHDQNNHNTDRSSHKDSMN" 
639. .1451 

/note="7tm_l; Region: 7 transmembrane receptor (rhodopsin 
family) " 

/db_xref="CDD:pfam00001" 



ORIGIN 



Query Match 63.6%; 
Best Local Similarity 99.3%; 
Matches 2673; Conservative 



Score 2609.6; DB 9; 
Pred. No. 0; 
0; Mismatches 14; 



Length 2705; 
Indels 5; Gaps 



5; 



Qy 



Db 



134 AGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATCCATCCCACC 193 

M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

1 AGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATCCATCCCACC 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 



194 CGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAGTGCCCAGGA 253 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 CGGTCGTCGCCGGGGATTGGGGTCCCAGCGAGACCTCCCCGGGAGAAGCAGTGCCCAGGA 12 0 

254 AGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGAGCCCGGGAC 313 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 AGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGAGCCCGGGAC 18 0 

314 ACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGCCCAGGCGCC 37 3 

I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

181 ACCGGCCACCCTCCGCGCCACCCACCCTCGCCGGCTCCGGCTTCCTCTGGCCCAGGCGCC 24 0 



Qy 374 GCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAAAGTGAAGGT 433 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 241 GCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTG-AAAAAAAAGTGAAGGT 2 99 

Qy 434 GTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCA7\ATTTGCCTCAAGATGGAAACC 493 

I I M I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 300 GTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAGATGGAAACC 359 

Qy 494 CTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGTGATAATCCT 553 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I 

Db 360 CTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGTGATAATCCT 419 

Qy 554 GAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTTCGTGGCACA 613 

I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 0 GAGAGATACAGCACAAATCT7\AGCAATCATGTGGATGATTTCACCACTTTTCGTGGCACA 47 9 

Qy 614 GAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCCAGCAATGGC 67 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 48 0 GAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCCAGCAATGGC 539 

Qy 674 TCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTC7W\TACATTAAC 733 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I M I I I 

Db 54 0 TCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAATACATTAAC 599 

Qy 734 ACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGG7\ATGCAACTCTGCTCAGG 7 93 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 600 ACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC7\ACTCTGCTCAGG 659 

Qy 794 ATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCC 853 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 660 ATCATTTACCAGAACAAATGTATGAGGAATGGCCACTVACGCGCTGATAGCCAGTCTTGCC 719 

Qy 854 CTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCT 913 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 720 CTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCT 779 

Qy 914 GGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTT 973 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 78 0 GGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTT 839 

Qy 974 TTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGG 1033 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I 

Db 84 0 TTGCAGAAGTCCTCGGTGGGGATCACCGTCCTC7VACCTCTGCGCTCTTAGTGTTGACAGG 8 99 

Qy 1034 TACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCC 10 93 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 900 TACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCC 959 

Qy 1094 ATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGC 1153 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 960 ATTG7WVTTGTCTCCATCTGGATCCTGTCGTTTATCCTGGCCATTCCTGAAGCGATTGGC 1019 



Qy 1154 TTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCC 1213 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1020 TTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCC 1079 



Qy 


1214 


ACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGbGi i Ul Ai 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1080 


ACATCAAAATTCATGGAGTTCTACC7VAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTAT 


1139 


Qy 


1274 


TTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTG 


1 "5 "5 "5 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


1140 


TTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTG 


1199 


Qy 


1334 


AAC AGAAGGAAT GGC AGCT T GAGAAT T GC C CT CAGT GAAC AT CT T AAG CAGC Gl C GAGAA 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 




Db 


1200 


AACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGT^CATCTTAAGCAGCGTCGAGAA 


1259 


Qy 


1394 


GTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCAC 


1 /I "5 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 




Db 


1260 


GTGGCAAAAACAGTTTTCTGCTTGGTTGTT^TTTTTGCTCTTTGCTGGTTCCCTGTTCAT 


1319 


Qy 


1454 


TTAAGCCGT ATATT GAAGAAAACT GT GTATAACGAAATGGACAAG7\ACCGAT GT GAATTA 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1320 


TTAAGCCGTATATTGAAGAAAACTGTGTAT7UVCGAGATGGACAAGAACCGATGTG7\ATTA 


1379 


Qy 


1514 


CT T AGT T T CT TACT G CT C AT GGAT T AC AT CGGT AT T AACT T G GCAACC AT GAAT T CAT GT 


1 C T O 

lO /o 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1380 


CTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGT 


1439 


Qy 


1574 


ATAAAC C C C AT AGCT CT GT AT TT T GT GAG CAAGAAATT T AAAAAT T GT T T C CAGT CAT GC 


1 boo 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1440 


ATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTCCAGTCATGC 


1499 


Qy 


1634 


CTCTGCTGCTGCTGTTACCAGTCCA7\AAGTCTGATGACCTCGGTCCCCATGAACGGAACA 


1693 




1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1500 


CTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATGAACGGAACA 


1559 


Qy 


1694 


AGC AT C CAGT G GAAGAACCAC GAT CAAAACAAC C ACAACAC AGAC C GGAG CAGC CAT AAG 


1 T Q 


Db 


1560 


1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 

AGCATCCAGTGGAAGGACCACGATCAAAACAACCACAACACAGACCGGAGCAGCCATAAG 


1619 


Qy 


1754 


GACAGC AT GAACT GAC C AC C CTT AGAAGCACT C CT C GGTACT C C CAT AAT C CT CT CG GAG 


lo io 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


1620 


GACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATCCTCTCGGAG 


1679 


Qy 


1814 


AAAAA7\AT CACAAGGCAACT GTGACTCCGGG7\AT CTCTTCT CTGAT CCTT CTTCCTTAAT 


1 y / O 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1680 


ATUUyWVTCACAAGGCAACTGTGAGTCCGGGAATCTCTTCTCTGATCCTTCTTCCTTAAT 


1739 


Qy 


1874 


T C ACT C C CACAC C CAAGAAGAAAT G CT T T C CAAAAC C GCAA- GGT AGACT GGT T 1 A 1 C LA 


1 Q 9 

1 y oz 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1740 


TCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGGTAGACTGGTTTATCCA 


1799 


Qy 


1933 


CCCACAACATCTACGAATCGTACTTCTTT/VATTGATCTAAT 1 i ACAi Ai i Ui GuGi Gi i G 


1 Q Q 9 

1 y y 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 




Db 


1800 


CCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCTGCGTGTTG 


1859 


Qy 


1993 


TATTCAGCACTA7W\AATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAATGAAACCAG 


2052 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


1860 


TATT CAGCACT A7WWVT GGT GGGAGCT GGGGGAGAAT GAAGACT GTTTW^TGAAACCAG 


1919 


Qy 


2053 


AAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCT^GTACATGGCTAGCTTTTATG 


2112 



I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 192 0 AAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAGCTTTTATG 1979 

Qy 2113 GCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGATTAACGACA 2172 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1980 GCAGTTCTGGTGT^ATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGATTAACGACA 2039 

Qy 2173 AGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACACAATATGGGCTCA 2231 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 204 0 AGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCC7VAACACAATATGGGCTCA 2 099 

Qy 2232 GGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAA 2291 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2100 AGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAATAGCCTAA 2159 

Qy 2292 CATGATTATTTGAACTTATTTACACATAGTTTG-AAAAAAAAAAGACAi^AAATAGTATTC 2350 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2160 CATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAAGACAAAT^ATAGTATTC 2219 

Qy 2351 AGGTGAGCTVATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACACAAATTC 2410 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2220 AGGTGAGCAATTAGATTAGTATTTTCCACGTCACTGTTTATTTTTTTAAAACACAAATTC 2279 

Qy 2411 TAAAGCTACAACAAATACTACAGGCCCTTATyVGCACAGTCTGATGACACATTTGGCAGTT 2470 

M I I I I i I I I I I I I I I I I I I I I I I I M M M I I I I I I I I I I I I I M I I I I I I I I I I I I M 

Db 2280 TAAAGCTACAACAAATACTACAGGCCCTTT^AAGCACAGTCTGATGACACATTTGGCAGTT 2339 

Qy 2471 TAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATGGTGTTTT 2530 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 234 0 TAATAGATGTTACTCAAAGAATTTTTT7VAGAACTGTATTTTATTTTTTAAATGGTGTTTT 2399 

Qy 2531 ATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCTWVAGTTVATGCTTCAATCAGA 2590 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 24 00 ATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGT7\ATGCTTCAATCAGA 24 59 

Qy 2591 TAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAAATCAATG 2650 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 2460 TAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGAAAAATCAATG 2518 

Qy 2 651 TCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAGTGCACT 2710 

I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2519 TCAAGTACCAAAATGTTT^TGTATGTGTCATTTAACTCTGCCTGAGACTTTCAGTGCACT 2578 

Qy 2711 GTATATAGAAGTCTAAAACACACCTAAGAGATWyVGATCGAATTTTTCAGATGATTCGGA 2770 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I M I II 

Db 2579 GTATATAG7\AGTCTAAAACACACCTAAGAGAA7VAAGATCGAATTTTTCAGATGATTCAGA 2638 

Qy 2771 AATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCA 2822 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 2 639 AATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCA 2 690 
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/organism== * Homo sapiens (human) ' . 
Location/Qualifiers 
1. .2595 

/organism="Homo sapiens" 
/mo l_type=" genomic DNA" 
/db xref="taxon: 9606" 



PN 
PD 
PF 
PR 
PI 



PC 
PC 
CC 
FH 
FT 
FT 



Query Match 60.2%; Score 2470; DB 6; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 2481; Conservative 0; Mismatches 0; 



Length 2595; 
Indels 1; 



Gaps 



1; 



Qy 



Db 



1624 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 1683 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I M I M 

15 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAT^AAGTCTGATGACCTCGGTCCCCAT 74 



Qy 



Db 



1684 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 17 43 

I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

75 GAACGGAACAAGCATCCAGTGG7^G7\ACCACGATCAAAACAACCACAACACAGACCGGAG 134 



Qy 



Db 



174 4 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 18 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

135 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 194 



Qy 

Db 

Qy 

Db 



1804 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 1863 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

195 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 254 

1864 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTG 1923 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

255 CTTCCTTAATTCACTCCCACACCCAAGAAG7\AATGCTTTCCAAAACCGCAAGGTAGACTG 314 



Qy 1924 GTTTATCCACCCACAACATCTACG7U\TCGTACTTCTTTAATTGATCTAATTTACATATTC 1983 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 315 GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 374 

Qy 1984 TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAG7UVTG7\AGACTGTTAAA 2 043 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 375 TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 434 

Qy 2 044 TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCTVAGTACATGGCTA 2103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 435 TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 4 94 

Qy 2104 GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 2163 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 95 GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGG7\ACTGGTCACCATGA7\ACTTTAGAGA 554 

Qy 2164 TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 2223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 555 TT7\ACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 614 

Qy 2224 TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 22 83 

I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 615 TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 674 

Qy 2284 TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAAT 2343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 675 TAGCCTAACATGATTATTTG7\ACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAAT 734 

Qy 2344 AGTATTCAGGTGAGC7\ATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTT7VAAACA 24 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 735 AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 794 

Qy 24 04 CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 24 63 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I M I I I 
Db 7 95 CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 854 

Qy 24 64 GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 2523 

I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 855 GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 914 

Qy 2524 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 915 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCA7WVGT7\ATGCTTC 974 

Qy 2 584 AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAA 2643 

I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 975 AATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTA7\ATTTTGTATGAAAA 1033 

Qy 2644 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 2703 

I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1034 ATCAATGTCAAGTACC7VAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 1093 

Qy 2704 GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 2763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1094 GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 1153 

Qy 27 64 ATTCGGT^^TTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2823 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1154 ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 1213 

Qy 2824 CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 2 8 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1214 CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 1273 

Qy 2884 CCTTTTCCATATAGGA7VACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 2943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 1274 CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 1333 

Qy 294 4 AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 30 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1334 AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 13 93 

Qy 3004 GTATGT^CCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 3063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I 

Db 1394 GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 14 53 

Qy 3064 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 3123 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I M I I I I 
Db 1454 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 1513 

Qy 3124 ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 3183 

I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M M I I I M I I I 

Db 1514 ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTA7\ATTTCTTTTAGCCCATT 1573 

Qy 3184 TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 3243 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1574 TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 1633 

Qy 3244 ATGTATGGATTTAATCT7\ATCT7U^TAATTGTGCCCCGCAGTTGTGCCA7\AGTGCATAGTC 3303 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1634 ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 1693 

Qy 3304 TGAGCTA7\J\ATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 3363 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1694 TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 1753 

Qy 3364 AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 3423 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1754 AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 1813 

Qy 3424 GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 34 83 

I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 1814 GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 1873 

Qy 34 84 TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 3543 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1874 TTTGATA7\AGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 1933 

Qy 3544 TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 3603 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 1934 TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 19 93 

Qy 3604 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 3663 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I M I I I 



Db 



1994 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTT^GATAATT 2053 



Qy 


3664 


TGTTGGGCCATATTTTAGGACAGGTTyWVTAACATCAGGTTCCAGTTGCTTGAATTGCAA 


3723 




11, 1 1 1 ■ 1 1 1 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 i r 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 

M 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 M 1 M M 1 M M 1 M M 1 M 1 1 1 




Db 


2054 


T GT T GGGC CAT AT TT T AGGAC AG GT AAAATAACAT C AGGT T CCAGTT G CTT GAAT T G CAA 


Z 1 1. s3 


Qy 


3724 


GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAT^TCTATTATTCCACTGGCGCAT 


3783 




, , , , 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 t 1 t 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 N i M 




Db 


2114 


GG CTAAGAAGT ACT G C C CT T T T GT GT GT TAG C AGT CAAAT CT AT TAT T C C ACT GGC GC AT 


O 1 T Q 
Z L / O 


Qy 


3784 


CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 


3843 




, , , 1 1 t 1 ■ 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 M M 




Db 


2174 


CAT AT GCAGT GATATAT GCCTATAATATAAGCCATAGGTT CACACCATTTT GTTTAGACA 


O O O Q 


Qy 


3844 


ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 


3903 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M N 




Db 


2234 


ATT GT CTTTTTTT CAAGAT GCTTT GTTT CTTT CATATGAAAAA7\ATGCATTTT ATAAATT 


O O O Q 


Qy 


3904 


CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGT7WV 


3963 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 




Db 


2294 


CAGAAAGT CAT AGAT T T CT GAAGG C GT CAAC GT GC AT T T TAT T TAT G G ACT G GT AAGT AA 


o o c o 
Zoo J 


Qy 


3964 


CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 


4023 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2354 


CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 


2413 


Qy 


4024 


AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 


4083 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 




Db 


2414 


AACTTTGTAGAAATGAGCCAGAAGCC7VAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 


2473 



Qy 4 084 AATAAAACTTTACAGAT^AlCCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I 

Db 24 74 AATAAAAGTTTACAGAAACCTT 24 95 



RESULT 13 

D11144S8 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SEGMENT 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 



D11144S8 2595 bp DNA linear PRI 19-SEP-2002 

Homo sapiens gene for endothelin-A receptor, complete cds, exon 8 
and 3* flanking region. 
D11151 

D11151.1 GI:219628 

G protein-coupled receptor; endothelium; smooth muscle. 
8 of 8 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 2595) 

Hosoda,K., Nakao^K., Tamura,N., Arai,H,, Ogawa,Y., Suga,S., 
Nakanishi,S. and Imura,H. 

Organization, structure, chromosomal assignment, and expression of 

the gene encoding the human endothelin-A receptor 

J. Biol. Chem. 267 (26), 18797-18804 (1992) 

92406798 

1326535 

2 (bases 1 to 2595) 



AUTHORS 

TITLE 

JOURNAL 



FEATURES 

source 



CDS 



intron 



exon 



polyA_signal 
ORIGIN 



Hosoda, K. 

Direct Submission 

Submitted ( 18-MAY-1992 ) Kiminori Hosoda, Kyoto University School of 
Medicine, Department of Medicine; 54 Shogoin Kawahara-cho, 
Sakyo-ku, Kyoto, Kyoto 606, Japan (Tel : 81-75-751-3170, 
Fax:81-75-771-9452) 

Location/Qualifiers 

1. .2595 

/organism-"Homo sapiens" 
/mol__type=" genomic DNA" 
/db_xref="taxon: 9606" 
/ chromosome="4 " 

/clone_lib="lambda EMBL3 and lambda EMBL3SP6/T7" 

join (D11145. 1: 92. . 511, D11146 . 1 : 21 . . 148,011147.1:21. .219, 

D11148. 1:21. . 173, Dll 149. 1:21. . 154 , D11150 . 1 : 21 . .129, 

19. .159) 

/ codon_start=l 

/product- "endothelin~A receptor" 
/protein_id="BAA01920. 1" 
/db_xref="GI: 219630" 

/translation="METLCLRASFWLALVGCVISDNPERYSTNLSNHVDDFTTFRGTE 
LSFLVTTHQPTNLVLPSNGSMHNYCPQQTKITSAFKYINTVISCTIFIVGMVGNATLL 
RIIYQNKCMRNGPNALIASL7VLGDLIYWIDLPINVFKLLAGRWPFDHNDFGVFLCKL 
FPFLQKSSVGITVLNLCALSVDRYRAVASWSRVQGIGIPLVTAIEIVSIWILSFILAI 
PEAIGFVMVPFEYRGEQHKTCMLNATSKFMEFYQDVKDWWLFGFYFCMPLVCTAIFYT 
LMTCEMLNRRNGSLRIALSEHLKQRREVAKTVFCLWIF7VLCWFPLHLSRILKKTVYN 
EMDKNRCELLSFLLLMDYIGINLATMNSCINPIALYFVSKKFKNCFQSCLCCCCYQSK 
SLMTSVPMNGTSIQWKNHDQNNHNTDRSSHKDSMN" 
<1. .18 
/ number=7 
19. .2495 
/ number=8 
2474. .2479 



Query Match 60.2%; Score 2470; DB 9; Length 2595; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2481; Conservative 0; Mismatches 0; Indels 1; 



Gaps 



1; 



Qy 



Db 



162 4 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 1683 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

15 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 74 



Qy 

Db 

Qy 

Db 

Qy 

Db 



1684 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 17 43 

I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

7 5 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACT^CACAGACCGGAG 134 

1744 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGT^AGCACTCCTCGGTACTCCCATAAT 1803 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

135 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 194 

1804 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 18 63 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M M I I I I I I I I I I I 
195 CCTCTCGGAGAAA7VAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 254 



Qy 



1864 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTG 1923 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 255 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTG 314 

Qy 1924 GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 1983 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 315 GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTTUVTTGATCTAATTTACATATTC 374 

Qy 1984 TGCGTGTTGTATTCAGCACTAATW^ATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 2043 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 375 TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 434 

Qy 204 4 TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 2103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I 
Db 4 35 TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 494 

Qy 2104 GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 2163 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 4 95 GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 554 

Qy 2164 TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCA7UVCACAATA 2223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 555 TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 614 

Qy 2224 TGGGCTCAGGTCACTTTTATTTG7WVTGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 22 83 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 615 TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 67 4 

Qy 2284 TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAA7WW\AAAGACAAA7\AT 2343 

I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 675 TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAAT 734 

Qy 2344 AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 24 03 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I 

Db 735 AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 794 

Qy 2404 CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 24 63 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 795 C7\AATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 854 

Qy 2464 GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 2523 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 855 GGCAGTTTAATAGATGTTACTC7\AAGAATTTTTTAAGAACTGTATTTTATTTTTTA7^TG 914 

Qy 2524 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTC 2583 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I 
Db 915 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCTVT^AAGTAATGCTTC 97 4 

Qy 2584 AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAA 2 643 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 975 AATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGA7WV 1033 

Qy 2 644 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 27 03 

I I M I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 1034 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 1093 



Qy 2704 GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 2763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I 
Db 1094 GTGCACTGTATATAGAAGTCTAAAACACACCT7\AGAGAAA7^GATCGAATTTTTCAGATG 1153 



Qy 2764 ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2 823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 1154 ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 1213 

Qy 2824 CTCCTATTCTCTTAATTTTTGTT/^AAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 2883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1214 CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 1273 

Qy 288 4 CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTG7\A 2 943 

I I I M I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 127 4 CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 1333 

Qy 2 94 4 7WVTAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 3003 

I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1334 AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 1393 

Qy 3004 GTATG7\ACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTC7\AAGGGC 3063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I 

Db 1394 GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 1453 

Qy 3064 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 3123 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1454 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 1513 

Qy 3124 ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 3183 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1514 ATCTTTTACTAGTGTGTGTGTGTATATATATAAAC7VATTGTAAATTTCTTTTAGCCCATT 1573 

Qy 3184 TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 3243 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1574 TTTCTAGACTGTCTCTGTGG7\ATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 1633 

Qy 3244 ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 3303 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I M I I I I I I I I I I 
Db 1634 ATGTATGGATTTAATCTAATCTAAT?ATTGTGCCCCGCAGTTGTGCCA7\AGTGCATAGTC 1693 

Qy 3304 TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 3363 

M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1694 TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 1753 

Qy 3364 AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 3423 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1754 AGCAACCTTCTGCATTCATAAATCTTGTTyVTCATGTTACCATTACAAATGGGATATAAGA 1813 

Qy 3424 GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 34 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1814 GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 1873 

Qy 3484 TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 3543 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1874 TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 1933 



Qy 354 4 TTTGAAGTATTATATTGTTCTTATCCTCAATTCT^TGTGGTGATGAAATTGCCAGGTTGT 3603 

I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1934 TTTGTVAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 1993 



Qy 3604 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 3663 

I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I 
Db 1994 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 2053 

Qy 3664 TGTTGGGCCATATTTTAGGACAGGTTyWVTAACATCAGGTTCCAGTTGCTTGAATTGCAA 3723 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2054 TGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAA 2113 

Qy 3724 GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 37 83 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 2114 GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 2173 

Qy 37 84 CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 3843 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 2174 CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 2233 

Qy 3844 ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 3903 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2234 ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGATWWyVTGCATTTTATAAATT 2293 

Qy 3904 CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 3963 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 2294 CAGAAAGTCATAGATTTCTG7\AGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 2353 

Qy 3964 CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 4023 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I 
Db 2354 CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 2413 

Qy 4024 iQACTTTGTAGAAATGAGCCAGAAGCC7\AGGCCCTGAGTTGGCAGTGGCCCATAAGTGT7VA 4 083 

M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M M I I I 

Db 2414 AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 2 473 

Qy 4084 7\ATAA7^GTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I 
Db 2474 AATAAAAGTTTACAGAAACCTT 24 95 
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NOTICE: This sequence may not represent the entire insert of this 
clone. It may be shorter because we only sequence overlapping 
clone sections once, or longer because we provide a small overlap 
between neighboring data submissions. 

This sequence was finished as follows unless otherwise noted: 
all regions were double stranded, sequenced with an alternate 
chemistry, or covered by high quality data (i.e., phred quality 
30) ; an attempt was made to resolve all sequencing problems, such 
as compressions and repeats; all regions were covered by sequence 
from more than one subclone; and the assembly was confirmed by 
restriction digest. 
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Mapping information for this clone was provided by Dr. John D. 
McPherson, Department of Genetics, Washington University, St. Louis 
MO. For additional information about the map position of this 
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The clone sequenced to the right is RP11-56F3. Actual start of 
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base position 164920 of RP11-752L20. 

Data from AC083898 was used to finish this clone, AC093908. 

The sequence of AC067873 has been incorporated into AC093908. 
FEATURES Location/Qualifiers 
source 1. .164920 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/ chr omos ome= " 4 " 
/map-" 4" 

/clone-"RPll-752L20" 
/clone_lib="RPCI-ll" 
3. .112 

/rpt_family="Alu" 
323. .393 
/rpt_family="Ll" 
4328. .4359 
/ r p t_f ami 1 y= " AT_r i ch " 
4786. .4811 
/rpt__f amily=" (CA) n" 
4813. .4874 
/rpt_f amily=" (TC) n" 
4883. .4910 
/rpt_f amily=" (CA) n" 
4948. .5511 
/rpt_family-"Ll" 
5058. .5099 
/ rp t _f ami 1 y = " AT_r i ch " 
5129. .5164 
/rpt_family="AT_rich" 
5149. .5154 

/note="similar to Homo sapiens EST AW150086 (NID : g619807 8 ) 
xg36f05.xl" 
5837. .5927 

/ r p t_f ami 1 y= "MERl_t yp e " 
5930. .6038 
/rpt_family="L2" 
6126. .6196 

/ r p t_f ami 1 y= "MERl_t yp e " 
6261. .7668 
/rpt_family-"L2" 
6671. .6698 
/rpt_f amily=" (TC) n" 
7297. .7299 

/note="similar to Homo sapiens EST BE857602 
(NID:gl0371791) " 



repeat_region 
repeat_region 
repeat region 
repeater egion 
repeat_region 
repeat_region 
repeat_region 
repeat^region 
repeat^region 
misc_f eature 

repeat_region 
repeat_region 
repeat__region 
repeat_region 
repeat_region 
misc feature 



repeat_region 7694. .8060 

/ r p t_ f ami 1 y- " E RVL " 
repeat_region 8064. .8089 

/rpt_fainily=" (T)n" 
inisc_feature 8077. .8089 

/note="similar to Homo sapiens EST BG284616 

{NID:gl3035741) " 
misc_feature 8077. .8087 

/note="similar to Homo sapiens EST BE139388 (NID : g8601888 ) 

xr69h04 .xl" 
repeat_region 8274. ,8724 

/rpt_family="L2" 
repeat_region 8848. .9191 

/rpt_family="Ll" 
repeat_region 9177. .9211 

/ rp t_f amily- " AT_ri ch " 
misc_feature 9209. .9211 

/note="similar to Homo sapiens EST AA609692 (NID : g2458 120 ) 

afl6f01.sl" 
miscfeature 9221. .9903 

/note="similar to Sus scrofa EST BI401419 (NID : gl51804 80 ) " 
misc_feature 9221. .9526 

/note="similar to Homo sapiens EST R40029 (NID : g820778 ) 

yf68e04.sl" 
misc_feature 9221. .9403 

/note="similar to Homo sapiens EST AI933963 (NID: g5672833) 

wn95b05.xl" 
misc_feature 9222. .9438 

/note="similar to Homo sapiens EST BE139388 (NID: g8601888 ) 

xr69h04 .xl" 
misc_feature 9226. .9859 

/note="similar to Homo sapiens EST BI113803 

(NID:gl4564704) " 
misc_feature 9234. .9822 

/note="similar to Homo sapiens EST BE857602 

(NID:gl0371791) " 
misc__feature 9234. .9679 

/note="similar to Homo sapiens EST W67762 (NID : gl376634 ) 

zd37fll.rl" 
misc_feature 9234. .9620 

/note="similar to Homo sapiens EST AI342876 (NID : g4 080082 ) 

qo32a04.xl" 
misc_feature 9234. .9436 

/note="similar to Homo sapiens EST AA609692 (NID : g2458 120 ) 

afl6f01.sl" 
misc_feature 9234. .9436 

/note="similar to Homo sapiens EST AI969686 (NID : g5766504 ) 

wz70d08.xl" 
misc_feature 9234, .9436 

/note="similar to Homo sapiens EST AW150086 (NID: g6198078 ) 

xg36f05.xl" 
misc_feature 9253. .9722 

/note="similar to Bos taurus EST BI536408 (NID : gl5377518 ) " 
misc_feature 9295. .10091 

/note^"similar to Homo sapiens EST BG284616 
(NID:gl3035741) " 
misc feature 9300. .9802 



misc feature 



misc feature 



misc feature 



/note^"similar to Homo sapiens EST BF569074 
(NID:gll642454) " 

9301. .10099 

/note="similar to Homo sapiens EST BG492199 
(NID:gl3453711) " 

9302. .10048 

/note="similar to Homo sapiens EST BG683530 
(NID:gl3915027) " 
9423. .10120 

/note=="similar to Homo sapiens EST BG824910 
(NID:gl4172497) " 



Query Match 58.7%; Score 2409.2; DB 9; Length 164920; 

Best Local Similarity 99.4%; Pred. No. 0; 

Matches 2470; Conservative 0; Mismatches 8; Indels 6; Gaps 



5; 



Qy 1624 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 1683 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 93358 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 93417 

Qy 1684 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 1743 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 93418 GAACGGAACAAGCATCCAGTGGAAG7\ACCACGATCAAAACAACCACAACACAGACCGGAG 93477 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1744 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 1803 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

9347 8 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 93537 

1804 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 18 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

93538 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGAGTCCGGGAATCTCTTCTCTGATCCTT 93597 

1864 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAA-GGTAGACT 1922 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

93598 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGGTAGACT 93657 

1923 GGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATT 1982 
I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M 
93658 GGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATT 93717 

1983 CTGCGTGTTGTATTCAGCACTTyyVAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAA 2042 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I M 
93718 CTGCGTGTTGTATTCAGCACTAAAA7\ATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAA 9377 7 

2043 ATG7WVCCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCT 2102 

I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
9377 8 ATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCT 93837 

2103 AGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAG 2162 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
93838 AGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAG 93897 

2163 ATTAACGACAAGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACACAA 2221 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
938 98 ATT7\ACGAC7UVGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACACAA 93957 



Qy 



2222 



TATGGGCTCAGGTCACTTTTATTTGA7UVTGTCATTTGGTGCCAGTATTTTTTAACTGCAT 



2281 



Db 93958 TATGGGCTCAAGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCAT 94 017 

Qy 2282 AATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAA 2341 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 94018 AATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAA 94077 

Qy 2 342 ATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAA 24 01 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 94 07 8 ATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTGTTTATTTTTTTAAAA 94137 

Qy 2402 CACAAATTCTAAAGCTAC7UVC7\AATACTACAGGCCCTTAAAGCACAGTCTGATGACACAT 2461 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9413 8 CACAAATTCTTWVGCTACAACAAATACTACAGGCCCTTAT^GCACAGTCTGATGACACAT 94197 

Qy 2462 TTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAA 2521 

I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94198 TTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAA 94257 

Qy 2522 TGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCT 2581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94258 TGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCT 94 317 

Qy 2582 TCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATG7\A 2641 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M 
Db 94318 TCAATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGAA 94376 

Qy 2 642 AAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTT7VACTCTGCCTGAGACTTT 27 01 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 94 377 AAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTT 94436 

Qy 2702 CAGTGCACTGTATATAGT^GTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGA 27 61 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 94437 CAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGA 94 496 

Qy 2762 TGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATC 2821 

I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I'll I I I I I I M I I I I I I 
Db 94497 TGATTCAGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATC 94556 

Qy 2 822 ACCTCCTATTCTCTTAATTTTTGTTAAAATGTTT^ACTGGCAGTAAGTCTTTTTTGATCAT 28 81 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I II I II I I I I II I I I I I I II II I I II 
Db 94557 ACCTCCTATTCTCTTAATTTTTCTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCAT 94616 

Qy 2 882 TCCCTTTTCCATATAGGAAACATAATTTTG7\AGTGGCCAGATGAGTTTATCATGTCAGTG 2941 

I I II II I II I II I I I II I I I I I I I I I I I II I I I I II II I I II I I I I M I I I I I I I I I I II 

Db 94617 TCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTG 94676 

Qy 2942 AAAAATAATTACCCACA7\ATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTT 3001 

I II I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 94 677 AAAAATAATTACCCACAAATGCCACCAG — AACTTACGATTCTTCACTTCTTGGGGTTTT 94734 

Qy 3002 CAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTC7WVGG 3061 

I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 94735 CAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGG 947 94 

Qy 3062 GCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGA 3121 

I I I I I II I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 94 795 GCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGA 94 854 

Qy 3122 AAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCA 3181 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 94 855 AAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCA 94 914 

Qy 3182 TTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATG 3241 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 915 TTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATG 94 974 

Qy 3242 GTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCC7\AAGTGCATAG 3301 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ' 

Db 94975 GTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCTW^GTGCATAG 95034 

Qy 3302 TCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCT 33 61 

MINI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 95035 TCTGAG-TAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCT 95093 

Qy 3362 GTAGCAACCTTCTGCATTCATAT^ATCTTGTAATCATGTTACCATTACAAATGGGATATAA 3421 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95094 GTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAA 95153 

Qy 3422 GAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTT 34 81 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I 

Db 95154 GAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTT 95213 

Qy 3482 GGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTAC 3541 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95214 GGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTAC 95273 

Qy 3542 ACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTT 3601 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 95274 ACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTT 95333 

Qy 3602 GTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAA 3661 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95334 GTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAA 95393 

Qy 3662 TTTGTTGGGCCATATTTTAGGACAGGT7WNATAACATCAGGTTCCAGTTGCTTGAATTGC 3721 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95394 TTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGC 95453 

Qy 3722 AAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGC 37 81 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95454 AAGGCTAAGi\AGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGC 95513 

Qy 3782 ATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGA 3841 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I 

Db 95514 ATCATATGCAGTGATATATGCCTATAATAT7UVGCCATAGGTTCACACCATTTTGTTTAGA 95573 

Qy 3842 C7\ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAA 3901 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 95574 CAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAA 95633 

Qy 3902 TTCAGT^AAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGT 3961 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95634 TTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGT 95693 



Qy 3962 AACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAA 4 021 

I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 11 I I I I I I M I I I I I I I I I I M 

Db 95694 AACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAA 95753 

Qy 4 022 GTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGT 4081 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 95754 GTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGT 95813 

Qy 4 082 AAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I I I 

Db 95814 AAAATAAAAGTTTACAGAAACCTT 95837 
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variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



.53758, 56931. .57083, 



6; 



Qy 1624 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 1683 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 63528 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 63587 

Qy 1684 GAACGG/^CAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 1743 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 63588 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 63647 



Qy 1744 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 1803 

I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I 

Db 63648 CAGCCAT7VAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 63707 

Qy 1804 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 1863 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 637 08 CCTCTCGGAGAAAAAAATCAC7\AGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 63767 

Qy 1864 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGC7\A-GGTAGACT 1922 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 637 68 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCA7\AACCGCAAGGGTAGACT 63827 

Qy 1923 GGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATT 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I M 
Db 63828 GGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATT 63887 

Qy 1983 CTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAA 2042 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 638 8 8 CTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAA 63947 

Qy 2 043 ATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCT 2102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 63948 ATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCTVAGTACATGGCT 64007 

Qy 2103 AGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAG 2162 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64008 AGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAG 64067 

Qy 2163 ATTAACGACAAGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACACAA 2221 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I 

Db 64068 ATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACACAA 64127 

Qy 2222 TATGGGCTCAGGTCACTTTTATTTG7\AATGTCATTTGGTGCCAGTATTTTTTAACTGCAT 2281 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 64128 TATGGGCTC7UVGTCACTTTTATTTGA7VATGTCATTTGGTGCCAGTATTTTTTAACTGCAT 64187 

Qy 2282 AATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAA7\AAGACAAAA 2341 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I 
Db 64188 AATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAA 64247 

Qy 2342 ATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAA 24 01 

I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64248 ATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTGTTTATTTTTTTAAAA 64307 

Qy 24 02 CACAAATTCTAAAGCTAC7\ACA7VATACTACAGGCCCTTAAAGCACAGTCTGATGACACAT 24 61 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I 

Db 64308 CACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACAT 64367 

Qy 24 62 TTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAA 2521 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 64368 TTGGCAGTTTAATAGATGTTACTCAAAGTUVTTTTTTAAGAACTGTATTTTATTTTTTAAA 64427 

Qy 2522 TGGTGTTTTATTACT^GGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTTUVTGCT 2581 

I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 64428 TGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCA7\AAGTAATGCT 64487 



Qy 2582 TCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGT7VAATTTTGTATGAA 2641 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I 

Db 64488 TCAATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGAA 64546 

Qy 2642 AAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTT 2701 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64547 AAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTT 64 606 

Qy 27 02 CAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAG-AAAAAGATCGAATTTTTCAG 2760 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64607 CAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAAGATCGAATTTTTCAG 64666 

Qy 27 61 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2 82 0 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64 667 ATGATTCAGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 64726 

Qy 2 821 CACCTCCTATTCTCTTAATTTTTGTT7\AAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64727 CACCTCCTATTCTCTTAATTTTTCTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 64786 

Qy 28 81 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 647 87 TTCCCTTTTCCATATAGGAAACATTVATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 64 84 6 

Qy 2941 GAAAAAT7\ATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64847 G7WWVTAATTACCCACAAATGCCACCAG-AACTTAACGATTCTTCACTTCTTGGGGTTT 64905 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64906 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 64965 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 64966 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 65025 

Qy 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATTVAACAATTGTAAATTTCTTTTAGCCC 3180 

I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I 

Db 65026 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 65085 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I 

Db 65086 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 65145 

Qy 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAi^AGTGCATA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6514 6 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 65205 

Qy 3301 GTCTGAGCTAA7\ATCTAGGTGATTGTTCATCATGAC7^CCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 65206 GTCTGAG-TAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 652 64 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACi\AATGGGATATA 3420 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 65265 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 65324 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 348 0 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 65325 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 65384 

Qy 34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 65385 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 6544 4 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGTWVTTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 65445 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 65504 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 65505 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAAT7WVTTAGGTAAGATA 65564 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I i I I I I I I I I I I I I I M I I I I I I I I 

Db 65565 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 65624 

Qy 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I M I I I I I I 
Db 65625 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 65684 

Qy 3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M M I I I I I M I I I M I 
Db 65685 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 65744 

Qy 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGTVAAAAAATGCATTTTATAA 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 65745 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 65804 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I 
Db 65805 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 658 64 

Qy 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 65865 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 65924 

Qy 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 65925 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 65984 

Qy 4081 TA7\AATAAAAGTTTACAGAAACCTT 4105 

M I I I I I I I I I I I I I I I I I I I I I I I 
Db 65985 TAAAATAAAAGTTTACAGAAACCTT 66009 
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1 


4105 


100.0 


4105 


6 


7VBZ35259 


Abz35259 


2 


4105 


100.0 


4105 


6 


ABV94238 


Abv94238 


3 


4105 


100.0 


4105 


7 


ABZ42662 


Abz42662 


4 


4103.4 


100.0 


4105 


2 


AAQ34583 


Aaq34583 


5 


4103 


100. 0 


4105 


3 


7\AA38341 


Aaa38341 


6 


4079 


99.4 


4079 


7 


ACA56659 


Aca56659 


7 


2470 


60.2 


2595 


6 


ABK35492 


Abk35492 



Human gen 
Breast ca 
Human end 
ETa recep 
Human end 
Human sig 
Human end 



8 


2470 


60. 


2 


2595 


6 


AAL39858 


Aal398 58 


Human 


all 


9 


2470 


60. 


2 


2595 


6 


ABK94408 


Abk94408 


DNA en cod 


10 


1819. 6 


44. 


3 


1868 


3 


AAA34793 


Aaa34 /93 


Human 


aae 


11 


1819. 6 


44. 


3 


1868 


3 


AAA34781 


Aaa347 81 


Human 


ade 


12 


1819. 6 


44. 


3 


1868 


3 


AAF20915 


Aaf 20915 


Human 


end 


13 


1819. 6 


44. 


3 


1868 


3 


A?VF20903 


TV ''x r\ r\ r\ "> 

Aaf 20903 


Human 


low 


14 


1819. 6 


44 . 


3 


1868 


7 


ABZ96609 


Abz96609 


Human 


end 


15 


1819.6 


44 . 


3 


1868 


7 


ABZ96597 


Abz9559 / 


Human 


end 


16 


1819. 6 


44. 


3 


2008 


3 


AAA34782 


Aaa34782 


Human 


ade 


17 


1819. 6 


44. 


3 


2008 


3 


AAF2 0904 


Aaf 20904 


Human 


low 


18 


1819. 6 


44. 


3 


2008 


7 


ABZ96598 


Abz96598 


Human 


nuc 


19 


1819.6 


44. 


3 


5036 


3 


AAF21447 


Aaf 214 47 


Human 


end 


20 


1819.6 


44. 


3 


5036 


7 


ABZ97141 


Abz97141 


Human 


end 


21 


1819. 6 


44. 


3 


117608 


7 


ABZ97129 


7\bz97129 


Human 


rec 


22 


1819. 6 


44. 


3 


117609 


3 


AAF21435 


Aaf21435 


Human 


rec 


23 


1296.8 


31. 


6 


1310 


3 


AAA34780 


Aaa34780 


Human 


ade 


24 


1296.8 


31. 


6 


1310 


3 


A7\A34792 


Aaa34792 


Human 


ade 


25 


1296.8 


31. 


6 


1310 


3 


AAF20902 


Aaf20902 


Human 


end 


26 


1296. 8 


31. 


6 


1310 


3 


AAF2 0914 


Aaf 20914 


Human 


ELA 


27 


1296. 8 


31. 


6 


1310 


7 


ABZ96608 


7\bz96608 


Human 


ELA 


28 


1296.8 


31, 


6 


1310 


7 


ABZ96596 


Abz96596 


Human 


nuc 


29 


1296.8 


31. 


6 


146981 


3 


AAF21442 


Aa f 2 1 4 4 2 


Human 


ELA 


30 


1296. 8 


31. 


6 


146982 


7 


ABZ97136 


Abz97136 


Human 


ELA 


31 


1280. 8 


31. 


2 


1284 


5 


ABI97987 


Abi97987 


Non-endog 


32 


1266.8 


30. 


9 


1300 


7 


ABZ97244 


Abz97244 


Human 


end 


33 


1248.8 


30. 


4 


1284 


2 


AAQ63209 


Aaq63209 


Human 


end 


34 


521 


12. 


7 


560 


6 


ABZ34947 


Abz34947 


Human 


gen 


35 


412.4 


10. 


0 


451 


8 


ACH21748 


Ach2174 8 


Human 


adu 


36 


403.8 


9. 


8 


1965 


2 


AAQ25892 


Aaq25892 


Sequence 


37 


403.8 


9. 


8 


2018 


9 


7\DB52872 


Adb52 872 


Primary r 


38 


399 


9. 


7 


4301 


2 


AAQ34584 


Aaq34584 


ETb recep 


39 


396. 6 


9. 


7 


1406 


2 


AAQ53922 


Aaq53922 


Bovine ET 


40 


395. 8 


9. 


6 


1470 


7 


ACA56605 


Aca56605 


Human 


sig 


41 


395.8 


9. 


6 


1632 


6 


AAD24966 


Aad24966 


Human 


G-p 


42 


395. 8 


9. 


6 


1719 


3 


AAF2128 5 


Aaf21285 


Human 


low 


43 


395. 8 


9. 


6 


1719 


7 


ABZ96979 


Abz96979 


Human 


nuc 


44 


395. 8 


9. 


6 


1720 


3 


7W^.35163 


Aaa35163 


Human 


ade 


45 


395.8 


9. 


6 


1872 


3 


AAA35161 


Aaa35161 


Human 


ade 



ALIGNMENTS 



RESULT 1 
ABZ35259 

ID 7VBZ35259 standard; cDNA; 4105 BP. 
XX 

AC ABZ35259; 
XX 

DT 05-FEB-2003 (first entry) 
XX 

DE Human gene expression profile polynucleotide SEQ ID NO 370. 
XX 

KW Human; artery; endothelium; umbilical; vein; aorta; pulmonary artery; 

KW bronchial epithelium; prostate; muscle; lung fibroblast; osteoblast; 

KW tumour; microarray; genome mapping; antibiotic; antiviral; antifungal; 

KW gene expression; gene; ss. 



XX 

OS Homo sapiens . 
XX 

PN WO200274979-A2. 
XX 

PD 26-SEP-2002. 
XX 

PF 20-MAR-2002; 2002WO-US008456 . 
XX 

PR 20-MAR-2001; 2001US-0276947P . 
XX 

PA (ORTH ) ORTHO CLINICAL DIAGNOSTICS INC. 
XX 

PI Wan J, Wang Y; 
XX 

DR WPI; 2002-740862/80. 
XX 

PT New gene expression profile generated from primary, endothelial, 

PT epithelial, and muscle cell types, useful for identifying disease 

PT pathologies involving alterations of gene expression, e.g. cancer. 
XX 

PS Disclosure; Page 513-515; 850pp; English. 
XX 

CC The invention relates to a gene expression profile comprising one or more 

CC genes {ABZ34889-ABZ35692 ) and generated from a cell type. The cell type 

CC is a coronary artery endothelium, umbilical artery or vein endothelium, 

CC aortic endothelium, dermal microvascular endothelium, pulmonary artery 

CC endothelium, myometrium microvascular endothelium, keratinocyte 

CC epithelium, bronchial epithelium, mammary epithelium, prostate 

CC epithelium, renal cortical epithelium, renal proximal tubule epithelium, 

CC small airway epithelium, renal epithelium, umbilical artery smooth 

CC muscle, neonatal dermal fibroblast, pulmonary artery smooth muscle, 

CC dermal fibroblast, neural progenitor cells, skeletal muscle, astrocytes, 

CC aortic smooth muscle, mesangial cells, coronary artery smooth muscle, 

CC bronchial smooth muscle, uterine smooth muscle, lung fibroblast, 

CC osteoblasts or prostate stromal cell. The gene expression profile is used 

CC for determining the level of RNA expression for a sample, determining the 

CC phenotype of a cell and distinguishing cell types. The gene or a protein 

CC expression profile is useful in identifying disease pathologies involving 

CC alterations of gene expression. The assessment of expression profiles may 

CC provide meaningful information with respect to tumour type and stage, 

CC treatment methods, and prognosis. The gene or protein expression profile 

CC may also be used for creating microarrays . The microarray is useful for 

CC genetic and physical mapping of genomes, DNA sequencing, genetic or 

CC medical diagnosis, genotyping of organisms, confirming cell or tissue 

CC identifications and in identifying promising antibiotics, antiviral or 

CC antifungal agents 

XX 

SQ Sequence 4105 BP; 1138 A; 859 C; 845 G; 1263 T; 0 U; 0 Other; 

Query Match 100.0%; Score 4105; DB 6; Length 4105; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I M I I I I I I I I I I I I 

Db 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 



wy 


61 


Db 


61 


vY 


121 


Db 


121 




1 ft 1 

X O J. 


Db 


181 


yy 


^ ^ JL 




241 




0\J A. 




301 


yy 


0\J ± 


Db 


361 


yy 




Db 


421 


yy 


*i O J. 


Db 


481 


^y 


R4 1 


nh 


541 


yy 


601 


Db 


601 


^y 


661 


Db 


661 


Ov 

wy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 


Db 


841 



AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 

III I II I I M I I I I I I I I I Ml II I I I I I II I I I I I I I I I I M I I I M I I I I I I I 

AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 

CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

I I I II I I M I I I I I M I I II M II I II I I I II I I I II I I I I I II I M I I I I I I I I I I I I I 

CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 240 
I I II I I II I II I I I I I I II II I I I I I I M I II I M I I II I II I I I I I M I M I I I 



GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCG7VAGCCGCCGCCGCGC 300 

I I t I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

I I I I I II I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I 

CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGA7WV 420 
I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 420 

AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 48 0 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I M I I 

AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 540 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I M I I 

CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 540 

CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 
I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGTGATAATCCTGAGAGATACAGCAC7\AATCTAAGCAATCATGTGGATGATTTCACCAC 600 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAA/^TTACTTCAGCTTT 720 
I I I I I I M I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 72 0 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 7 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M M I I I M I I I I 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 7 8 0 

AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I II I I I I I I I I I I M I I I I I I I I I I 
AACTCTGCTCAGGATCATTTACCAGAAC7WVTGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I M I I M II I I M II I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I 

AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 



Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACA?\TGACTTTGGCGi Ai i IL-i i 


you 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 


Qy 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAAUUi bUtcrUi Ui 






1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 


Qy 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAAl iGGGAi 


T n p n 
1 U o u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


1080 


Qy 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1 14 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 




Db 


1081 


TTTGGTAACTGCCATTG7WVTTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 


Qy 


1141 


T GAAG C GATT G GCT T C GTCAT GGT AC CCTT T GAAT AT AGGGGT GT^CAGC AT AAAACCT G 


T o n n 

iz UU 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATATWVCCTG 


1200 


Qy 


1201 


TAT GCT CAAT GC CAC AT C?J\AAT T CAT GGAGT T C T ACCAAGAT GT AAAGGACT GGT GGCT 


T o n 

12 dU 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 1 1 1 




Db 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTTW^GGACTGGTGGCT 


1260 


Qy 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1 o o n 
loZ U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 


Qy 


1321 


TT GT GAGAT GT T GAAC AGAAGG7UVT GGC AGCT T GAGAAT T GC C CT C AGT GTUVCAT CTT AA 


T o o n 
l^o U 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 




Db 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 


Qy 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


14 4 U 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 




Db 


1381 


GCAGCGTCGAGAAGTGGCAAAT^ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 


Qy 


1441 


GT T C C CT CTT C ACT TAAGCC GT AT ATT GAAGAAAACT GT GT ATAAC GA7\AT GGACAAGAA 


T c: n n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 


1500 


Qy 


1501 


CC GAT GT GAAT T ACTT AGTT T CT T ACT G CT CAT GGAT TAG AT C G GT ATT AACT T GGCAAC 


1 R n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 


Qy 


1561 


CAT GAATT CAT GTATTWVC CC CAT AGCT CT GT AT T T T GT GAG CAAGAAAT T TAA7\AATT G 


1 o n 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 




Db 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1620 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGi CI GAlGACCi CGbiUuu 


1 ft n 

i Do u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 


Qy 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1740 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


1681 


.CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACTyVCACAGACCG 


1740 


Qy 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 



Db 


1741 


wy 


1801 


Db 


1801 


n\T 
yy 


1861 


Db 


1861 


yy 


X nC. -L 


Db 


1921 


yy 


X -7 O X 


Db 


1981 


yy 


^1 U 1 X 


Db 


2041 


yy 


X U X 


nh 


2101 




71 fi1 

^ X U X 


Db 


2161 


yy 


99 ■? 1 




2221 


yy 


99 ft 1 


Db 


2281 


yy 


9^41 

O ^ X 


Db 


2341 


yy 


94 01 

ii. ri U X 


Db 


2401 


Ov 


2461 


Db 


2461 


Qy 


2521 


Db 


2521 


Qy 


2581 



I I I I I I I M I I I I I I I I I I I I I I I M I I M I I I I M I I I I I I I I I I I I I I I I I I 

GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

TU^TCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 

CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

TTCTGCGTGTTGTATTCAGCACT7WWVATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2040 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I 

TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2 040 

AT^ATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I I I I I I I I I M M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAA7UVTAGAGCTTTCAAGTACATGG 2100 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTC7\ATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

MINI M I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I 

AGATTAACGAC7\AGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 80 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG7\7\AAAAAAAAGACAAA 2340 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I M I I I I I I I I I I I I I I I I M I I I M I I I I M I I I I I I I I I I M I I I I I I I M I I I I I I I 
AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTT7W\ 24 00 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

ACAC7WVTTCTAAAGCTAC7y\CAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I N I I I I I I I I I I I I 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTT7\A 252 0 

ATGGTGTTTTATTACTVAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 
I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I N I I I I I I I I I M I 
ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 258 0 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

M I I I I I I I I I I I I I M I I I M I I I I I M I M I M I I I I I I I I I I I I I I I I I I I M I I M 



Db 


2581 


Qy 


2641 


Db 


2641 


Qy 


2701 


Db 


2701 


Qy 


2761 


Db 


2761 


Qy 


2821 


Db 


2821 


Qy 


2881 


Db 


2881 


Qy 


2941 


Db 


2941 


Qy 


3001 


Db 


3001 


Qy 


3061 


Db 


3061 


Qy 


3121 


Db 


3121 


Qy 


3181 


Db 


3181. 


Qy 


3241 


Db 


3241 


Qy 


3301 


Db 


3301 


Qy 


3361 


Db 


3361 


Qy 


3421 


Db 


3421 



2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

A7WVTCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I 

AAAATCAATGTCAAGTACCT^AAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

TCAGTGCACTGTATATAGAAGTCT7\AAACACACCTAAGAGA7\AAAGATCGAATTTTTCAG 2760 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I 

TCAGTGCACTGTATATAGTUVGTCTAAAACACACCTTy^GAGAAAAAGATCGAATTTTTCAG 2760 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I 
ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2 820 

CACCTCCTATTCTCTTAATTTTTGTTTUVAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 

I I M I I I I I I I I I I I I I I I I I I I I M I M M I I M M I I M I N I I I I I I I I I I I I I I I I 

CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 

TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I 

TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

GAAAAATT^ATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I 
GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I N I I I I I I I I I I I I I I I I I I I I 

TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 30 60 

GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 312 0 

AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I 

AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 40 

I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I M I M I I I I I M I I I I I I I I I I I I I I 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I M I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I 

GGTATGTATGGATTTAATCT7\ATCTAATAATTGTGCCCCGCAGTTGTGCC7U\AGTGCATA 3300 

GTCTGAGCTA7WVTCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I M M I I I I I I I I I I I I I I I I I M I I I I I 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 
TGTAGCAACCTTCTGCATTCATAAATCTTGTT^TCATGTTACCATTACAAATGGGATATA 3420 

I M I I I M I I I I I I I I I I I M M I I I I I I I I I I I M I I I I I I M I M I I I I M M I I I I I 

TGTAGC7^CCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACA7\ATGGGATATA 3420 

AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I 
AGAGGCAGCGTG7WVGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 3480 



Ov 


3481 


Db 


3481 


Ov 


3541 


Db 


3541 


Ov 


3601 


Db 


3601 


Ov 


3661 


Db 


3661 


Ov 


3721 


Db 


3721 


Ov 


3781 


Db 


3781 


Ov 

wy 


3841 


Db 


3841 


Ov 

yy 


3901 


Db 


3901 


Ov 

wy 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 
I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
CACTTTGAAGTATTATATTGTTCTTATCCTCTUVTTCAATGTGGTGATGAAATTGCCAGGT 3600 



TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 



3660 



3660 



3720 



3720 



3780 



CAAGGCTJ\AG7VAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 8 0 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 



ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAA7\AATGCATTTTATAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 



3900 



3900 



3960 



ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I i I I I I I I I I I I 

ATTCAGAi\AGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 39 60 

TAACTGTGGTTTACTAGCAGGAATATTTCCT^TTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TAACTGTGGTTTACTAGCAGGAATATTTCC7\ATTTCTACCTTTACTACATCTTTTCAACA 4 020 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M i M I M I I I 

AGTAACTTTGTAGAAATGAGCCAGT^GCCT^AGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 0 8 0 

TAAAATA7\AAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I I I I 

TAAAATAAAAGTTTACAGAAACCTT 4105 



RESULT 2 
ABV94238 

ID ABV94238 standard; cDNA; 4105 BP. 
XX 

AC ABV94238; 
XX 

DT 08-JAN-2003 (first entry) 
XX 

DE Breast carcinoma related nucleotide sequence SEQ ID NO: 229. 
XX 

KW Human; breast carcinoma; cancer; tumour; cytostatic; anti-tumour; gene; 



KW ss . 
XX 

OS Homo sapiens. 
XX 

PN WO200246467-A2. 
XX 

PD 13-JUN-2002. 
XX 

PF 07-DEC-2001; 2001WO-IB002811 . 
XX 

PR 08-DEC-2000; 2000US-0254090P . 

PR 07-DEC-2001; 2001US-00007926 . 
XX 

PA (IPSO-) IPSOGEN. 
XX 

PI Bertucci F, Houlgatte R, Birnbaum D, Nguyen C, Viens P, Fert V; 
XX 

DR WPI; 2002-619023/66. 
XX 

PT Novel polynucleotide library useful in molecular characterization of a 

PT carcinoma, comprising a pool of polynucleotide sequences or its 

PT subsequences which are either underexpressed or overexpressed in tumor 

PT cells. 

XX 

PS Claim 1; Page 258-259; 401pp; English. 
XX 

CC The present invention describes a polynucleotide library (I) useful in 

CC the molecular characterisation of a carcinoma, comprising a pool of 

CC polynucleotides or its subsequences which are either underexpressed or 

CC overexpressed in tumour cells, and correspond to any of the 

CC polynucleotide sequences chosen from the 468 sequences given in ABV94010 

CC to ABV94477. Also described: (1) a polynucleotide array (II) useful for 

CC the prognosis or diagnostic of tumour, comprising (I); and (2) detecting 

CC (Ml) differentially expressed polynucleotide sequences which are 

CC correlated with a cancer, involves obtaining a polynucleotide sample from 

CC a patient, and reacting the polynucleotide sample obtained with a probe 

CC immobilised on a solid support, where the probe comprises any combination 

CC of the polynucleotide sequences of (I) or its expression products encoded 

CC by polynucleotide sequences of (I), and detecting the reaction product. 

CC (I) have cytostatic activities and can be used as anti-tumour agents. (I) 

CC is useful in molecular characterisation of a carcinoma. (I) and (II) are 

CC useful for the prognosis or diagnostic of tumour, in differentiating a 

CC normal cell from a cancer cell, detecting a hormone sensitive tumour 

CC cell, differentiating a tumour with lymph nodes from a tumour without 

CC lymph nodes, differentiating antracycline-sensitive tumours from 

CC antracycline-insensitive tumours, and classifying good and poor prognosis 

CC primary breast tumours. (I) is useful for large-scale molecular 

CC characterisation of breast cancer that help in prediction, prognosis and 

CC cancer treatment, and for detecting differentially expressed genes that 

CC correlated with a cancer 

XX 

SQ Sequence 4105 BP; 1138 A; 859 C; 845 G; 1263 T; 0 U; 0 Other; 



Query Match 100.0%; Score 4105; DB 6; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 4105; Conservative 0; Mismatches 0; 



Length 4105; 

Indels 0; Gaps 0; 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 


Qy 


541 


Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 



G7\ATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I I I M I I I I I I I I I I M I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M M 

GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I 

AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I M I 
CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I 

CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGT^AGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I 

GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I M I I 
TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 420 

AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCJ^ATT^GAGATATTTCCTCAAATTTGCCT 48 0 

I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAAAAGTGAAGGTGTA7\AAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I 

CAAGATGG7WVCCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 540 

CAGTGATAATCCTGAGAGATACAGCACAAATCTT^GCAATCATGTGGATGATTTCACCAC 600 

I I I I I I I I I I II I M I I I I I I I I I I I I I M I I I I I I I M I I I I I M I I I I I I I I I I M M 

CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I II I I I M I I II II 11 I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I I I I 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

II I II II M II I II I II II I II M II II I M I I I I M M II II I II I II M I I I II II II 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 7 80 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I 

CAAATACATTj^ACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 7 80 

AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I 

AACTCTGCTCAGGATCATTTACCAGAACAT^TGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 



841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGG7VATTGGGATTCC 108 0 

1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 12 0 0 

12 01 TATGCTCAATGCCACATCTWU^TTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

12 01 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

12 61 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

12 61 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 

1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 15 00 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I i I I M I I I M I I I I I 
14 41 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTTWVCTTGGCT^C 1560 

1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1620 

1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

I I I I I I I M I I I I M I I M I I I I I I I M I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I 

1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCA7WVGTCTGATGACCTCGGTCCC 168 0 
1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 17 4 0 

I I I I I I I I I I I I M M I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I 



Db 


1681 


CATGAACGGi\AC7UVGCATCCAGTGGAAGAACCACGATCA7W^.CAACCAC7iJ\CACAGACCG 


1740 


Qy 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCC 1 Cbb 1 A*^ 1 


1 ft n n 

J. o u u 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M N 1 1 1 




Db 


1741 


GAGCAGCCATTU^GGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 


Qy 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATC i C i 1 C i Ui laAi 


X O D U 




1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 


Qy 


1861 


CT T CT T OCT T AAT T C ACT C C C ACACC CAAGAAGAAAT GOT T T CCAAAACC GCAAGGT AGA 


1 Q9 n 
± y z u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1920 


Qy 


1921 


CT GGT T T AT CCAC C CACAAC AT CT AC GAAT CGT ACT T CT T T7\AT T GAT CT AAT T T AC AT A 


i y o u 




1 M 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 IN 1 1 1 1 1 1 1 1 M 1 1 




Db 


1921 


CTGGTTTATCCACCCACAACATCTACGTyVTCGTACTTCTTTAATTGATCTAATTTACATA 


1980 


Qy 


1981 


T T CT GC GT GTT GT ATT C AG C ACTAAAAAAT GGT GG GAGCT G GGGGAGAAT GAAGACT GT T 


o fi yi n 
Z U4 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 


Qy 


2041 


AAAT GAAACCAGAAGGATATTT ACTACTTTT GCAT GAAAATAGAGCTTT CAAGTACAT GG 


Z 1 uu 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATG7VAAATAGAGCTTTCAAGTACATGG 


2100 


Qy 


2101 


CT AG CTT TT AT GGC AGT T CT GGT GAAT GT T CAAT G GGAACT G GT CAC CATGAAACT T T AG 


z X DU 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2101 


CTAGCTTTTATGGCAGTTCTGGTG7UVTGTTCAATGGGAACTGGTCACCATGAAACTTTAG 


2160 


Qy 


2161 


AGAT TAAC GACAAGATT T T CT ACTTT TT T TAAGT GAT TT T T T GT C CT T C AG C CAAAC AC A 


o o o n 

zzz u 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 N 1 N 1 1 1 1 




Db 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCC7VAACACA 


2220 


Qy 


2221 


AT AT GGG CT C AGGT C ACT T T T AT TT GAAAT GT C AT T T GGT GC C AGT AT T TT T T AACT GC A 


o o Q n 
ZZ o U 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 




Db 


2221 


ATATGGGCTCAGGTCACTTTTATTTG7WVTGTCATTTGGTGCCAGTATTTTTTAACTGCA 


2280 


Qy 


2281 


TT^T AGC CTAACAT GAT TAT T T GAACT T AT TT ACAC AT AGT T T GAAAAAAAAAAGACAAA 


Zo4 u 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2281 


TJ\ATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 


2340 


Qy 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTAi iiAJ.iilii i AAA 


Z 4 U U 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 


2400 


Qy 


2401 


ACACA/yVTTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 


2460 




1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2401 


ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 


2460 


Qy 


2461 


— _ — _ ™ ™ ^ -» y— 1 n-i i-n r-i-i -r -n m Ti ^ TV m m m Ti m < TV TV TV TV TV m m m m mm 7\ TV /"* T\ 7\ f~* rn rn 7\ rn rp rprp tv rprp rp rp rn rn tv 7\ 

TTTGGCAGTTTTVATAGATGTTACTCAAAGAATTTTTTAAGAALiOiAl 1 1 iAi i l i i iAA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ( 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 


Z 3Z U 


Db 


2461 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 M 1 M 1 1 M 1 M 1 M 1 1 1 M 1 M 1 1 1 1 i 1 1 1 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTT7y\GAACTGTATTTTATTTTTTAA 


2520 


Qy 


2521 


ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 


2580 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 M 1 1 




Db 


2521 


ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 


2580 



Ov 
Sly 


2581 


Db 


2581 




2641 


Db 


2641 




2701 


Db 


2701 




/ U J. 


Db 


2761 




z. O ^ J. 


Db 


2821 


wy 


2881 


Db 


2881 


yy 


^ 3' X 


Db 


2941 


yy 


O U U X 


Db 


3001 


yy 


O U U X 


Db 


3061 




3121 


Db 


3121 


Ov 

wy 


3181 


Db 


3181 


Ov 


3241 


Db 


3241 


Qy 


3301 


Db 


3301 


Qy 


3361 


Db 


3361 



TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTATiATTTTGTATGA 264 0 

AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I M I 

AAAATCAATGTCAAGTACC7WVATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I M M I I I I I I I I I I I I I I I I I I M I I M 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGTVATTTTTCAG 27 60 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I M M I I I I I M I I I I I I 
ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

CACCTCCTATTCTCTTAATTTTTGTTA7U\ATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2 8 80 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I 

CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGT7VAGTCTTTTTTGATCA 2880 

TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

TTCCCTTTTCCATATAGGA7\ACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2 94 0 

GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
GAAAAATTU^TTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I M M I I I I I I 

TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCTW^G 3060 

GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I M I M I I I M I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I M I 

GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTA7\ATTTCTTTTAGCCC 318 0 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 40 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I M I I I I I I I I I I I I I I I I I 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 4 0 

GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGTATGTATGGATTTTKATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCT^AAGTGCATA 3300 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 



Qy 3421 AGAGGCAGCGTGA7\AGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I 

Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

Qy 34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTC7\ATTCAATGTGGTGATGA7\ATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCj\ATGTGGTGATGAAATTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

Qy 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

111111111111111111111111111111111111111111111111111111111111 
Db 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

Qy 3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 4 0 

Qy 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I 
Db 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

Qy 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

Qy 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 4021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

Qy 4081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I M I I I I I I I I I I I I I I I I I I 
Db 4081 TAAAATA7W\.GTTTACAGAAACCTT 4105 



RESULT 3 
ABZ42662 

ID ABZ42662 standard; DNA; 4105 BP. 
XX 

AC ABZ42662; 
XX 

DT 04-MAR-2003 (first entry) 
XX 



DE Human endothelin A receptor nucleotide SEQ ID NO: 115. 
XX 

KW G protein-coupled receptor; GPCR; antigenic peptide; gene therapy; 

KW G protein-coupled receptor modulator; antibody; immune- related disease; 

KW growth-related disease; cell regeneration-related disease; AIDS; cancer; 

KW iramunological-related cell proliferative disease; autoimmune disease; 

KW Alzheimer's disease; atherosclerosis; infection; osteoarthritis; allergy; 

KW osteoporosis; cardiomyopathy; inflammation; Crohn's disease; diabetes; 

KW graft versus host disease; Parkinson's disease; multiple sclerosis; pain; 

KW psoriasis; anxiety; depression; schizophrenia; dementia; memory loss; 

KW mental retardation; epilepsy; asthma; tuberculosis; obesity; nausea; 

KW hypertension; hypotension; renal disorder; rheumatoid arthritis; trauma; 

KW ulcer; gene; ds . 

XX 

OS Homo sapiens. 
XX 

FN WO200261087-A2. 
XX 

PD 08-AUG-2002. 
XX 

PF 19-DEC-2001; 2001WO-US050107 , 
XX 

PR 19-DEC-2000; 2000US-0257 14 4 P . 
XX 

PA (LIFE-) LIFESPAN BIOSCIENCES INC. 
XX 

PI Burmer GC, Roush CL, Brown JP; 
XX 

DR WPI; 2003-046718/04. 

DR P-PSDB; ABP81816. 
XX 

PT New isolated antigenic peptides e.g., for G protein-coupled receptors 

PT (GPCR) , useful for diagnosing and designing drugs for treating conditions 

PT in which GPCRs are involved, e.g. AIDS, Alzheimer's disease, cancer or 

PT autoimmune diseases. 

XX 

PS Disclosure; Fig 1; 523pp; English. 
XX 

CC The present invention describes antigenic peptides (I) comprising: (a) 

CC any one of 1601 sequences (see ABP82019 to ABP83619) of 12-24 amino 

CC acids. Also described: (1) an assay for the detection of a particular G 

CC protein-coupled receptor (GPCR) or a candidate polypeptide in a sample; 

CC and (2) an isolated antibody having high specificity and high affinity or 

CC avidity for a particular GPCR. (I) can be used as GPCR modulators and in 

CC gene therapy. The antigenic peptides for GPCRs are useful in detecting an 

CC antibody against a particular GPCR, and in the production of specific 

CC antibodies. The peptides and antibodies are also useful for detecting the 

CC presence or absence of corresponding GPCRs. The antigenic peptides for 

CC GPCRs and antibodies are useful for diagnosing and designing drugs for 

CC treating immune-related diseases, growth-related diseases, cell 

CC regeneration-related disease, immunological-related cell proliferative 

CC diseases, or autoimmune diseases, e.g. AIDS, Alzheimer's disease, 

CC atherosclerosis, bacterial, fungal, protozoan or viral infections, 

CC osteoarthritis, osteoporosis, cancer, cardiomyopathy, chronic and acute 

CC inflammation, allergies, Crohn's disease, diabetes, graft versus host 

CC disease, Parkinson's disease, multiple sclerosis, pain, psoriasis, 

CC anxiety, depression, schizophrenia, dementia, mental retardation, memory 



CC loss, epilepsy, asthma, tuberculosis, obesity, nausea, hypertension, 

CC hypotension, renal disorders, rheumatoid arthritis, trauma, ulcers, or 

CC any other disorder in which GPCRs are involved. The antibodies may be 

CC used in immunoassays and immunodiagnosis . ABZ42523 to ABZ42869 encode 

CC GPCR proteins given in 7VBP81675 to ABP82018, which are used in the 

CC exemplification of the present invention 
XX 

SQ Sequence 4105 BP; 1138 A; 859 C; 845 G; 1263 T; 0 U; 0 Other; 



Query Match 100.0%; Score 4105; DB 7; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



vy 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGG7\AGGTCTGGAGCTTTGGGAGG 


60 




61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 




Db 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 


vy 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 M 1 1 1 N 1 1 N N 1 1 1 1 1 1 1 




Db 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 




241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 


Ov 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 




Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


/ion 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 


Qy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 


Qy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 M 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGT7\AT 


540 


Qy 


541 


CAGTGATTWVTCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 


Qy 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 



Qy 


661 


ACCCAGCAATGGCTC7\ATGCACAACTATTGCCCACAGCAGACTAAAATTACi iL,/\ijL.i i i 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 


Qy 


721 


CAAAT AC AT T AACACT GT GAT AT CTTGT ACT AT TT T CATC GT GG GAAT GGT GGGGAAT GC 


"7 R n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 


Qy 


781 


AACTCTGCTCAGGATCATTTACCAG7\ACAAATGTATGAGGAATGGCCCCAACGCbC i GAl 


O u 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M M 1 1 N 1 1 




Db 


781 


T^ACTCTGCTCAGGATCATTTACCAGT^ACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 


Qy 


841 


AG CC AGT CT T G C C CTT GGAGAC CT T AT CT AT GT GGT CATT GAT CT C C CT AT CAAT GT ATT 


Q n n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 


Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


Q n 

y bu 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 




Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGC7VA 


960 


Qy 


961 


GCTGTTCCCCTTTTTGCAG7\AGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


T n o n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 


Qy 


1021 


T AGT GTT GAC AGGT ACAGAG CAGT T GCCT C CT GGAGT C GTGTT C AGGGAAT T GGGAT T C C 


1 ri Q n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


1080 


Qy 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


il4U 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 


Qy 


1141 


T GAAGC GAT TGGCTTCGT CAT GGT AC CCT TT GAAT AT AGGGGT GAAC AG CAT AAAAC CT G 


1 o n n 
UU 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 


1200 


Qy 


1201 


TAT GCT CAAT GCC AC ATCAAAATT C AT GGAGTT C TAG CAAGAT GTAAAGGACT GGT G G CT 


1 o £1 n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 


Qy 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 


Qy 


1321 


TT GTGAGATGTT GAACAG7\AGGAAT GGCAGCTT GAGT^TT GCCCT CAGT GAACAT CTTAA 


-1 Q Q n 

1 O D U 


Db 


1321 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGTiLATTGCCCTCAGTGAACATCTTAA 


1380 


Qy 


1381 


GCAGCGTCGAGAAGTGGC7VAAAA.CAGTTTTCTGCTTGGTTGTAAT1 1 1 IGCiCi 1 ibUib 


141 fl U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 


Qy 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 


1500 






1 1 1 1 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGA7\ATGGACAAG7UV 


1500 


Qy 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 



Db 


1501 


C C GAT GTGAAT TACT TAGTT TCI lACibCiCAlbbAJ. iAUAiCGGiAl iAACl 


1 SfiO 


Qy 


1561 


CATGAATTCATGTATA7VACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1620 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1561 


CAT GAAT T CAT GT AT AAAC C C CAT AG C T CT GT AT T T T GT GAGC AAGAAAT TT AAAAAT T G 


1 (^9 0 
± oz u 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1621 


T TT C C AGT CAT GC CT CT GCT GCT GCT GT T ACCAGTC CAAAAGT CT GAT G AC CT C G GT C C C 


1 p n 
1 oo u 


QV 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1740 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 M 




Db 


1681 


CAT GAAC G GAAC7\AGC ATC C AGT GGAAGAAC C AC GAT CAAAACAAC CACAACAC AGAC C G 


1 T /I fl 

1 / 4 U 


Qv 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 




1 1 1 i 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


1741 


GAGCAGCCATAAGGACAGCAT GAACT GACCACCCTT AGAAGCACT CCT CGGTACT CC CAT 


1 Q n n 
i o u u 


Qv 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 M 1 




Db 


1801 


AAT C CT CT C GGAGAAAAAAAT CAC7\AGGCAACT GT G ACT CC G GGAAT CT CTT CT CT GAT C 


1 o dU 


Ov 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1920 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1861 


CT T CTT C CTTAAT T C ACT CC C AC AC C CAAGAAGAAAT GCTT T C CAAAAC C GCAAGGT AGA 


1 Q o n 


Ov 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


1921 


CT GGT T TAT C CAC C C ACAAC AT CT AC GAAT C GT ACTT CTT T AATT GAT C T AATT T ACAT A 


1 Q o n 


Qv 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1981 


T T CTGC GT GT T GT AT T C AGC ACTAAAAAAT GGT GGGAG CT GGGG GAG7\AT GAAGACT GT T 


ZU4U 


Ov 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTC7\AGTACATGG 


2100 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


2041 


AAATGAAACCAGAAGGAT ATTTACTACTTTT GCAT GAAAATAGAGCTTT CAAGTACATGG 


Z 1 UU 


Qv 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 


2160 




1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 M i 1 1 1 




Db 


2101 


CTAGCT T T TAT GGCAGT T CT GGT GAAT GT T CAAT G G GAACT GGT CAC CAT G7\AACT T TAG 


o 1 £^ n 
Z 1 oU 


Qy 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 


2220 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


2161 


AGATT AAC GACAAGAT T T T CT AC T T T TTT TAAGT GATTT TT T GT CCT T C AG C CAAAC AC A 


o o 9 n 
zz z u 


Qy 


2221 


ATATGGGCTCAGGTCACTTTTATTTGTWVTGTCATTTGGTGCCAGTATTTTTTAACTGCA 


2280 




1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 M II II M 1 1 M 1 II 




uD 


OOO'] 
AZZ 1 


2iT ZiTr rrr'Trnrr TP* aPTTTTATTTf^ A A ATnTrATTTGGTGCC AGT ATTTTTTAACTGCA 


2280 


Qy 


2281 


TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGAC7V7VA 


2340 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II M 1 II 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 




Db 


2281 


TAATAGCCTAACATGATTATTTG7VACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 


2340 


Qy 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 


2400 



I M I I I I I I I I I I I I I I I I I I M M I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I 



Db 


2341 


Qy 


2401 


Db 


2401 


Qy 


2461 


Db 


2461 


Qy 


2521 


Db 


2521 


Qy 


2581 


Db 


2581 


Qy 


2641 


Db 


2641 


Qy 


2701 


Db 


2701 


Qy 


2761 


Db 


2761 


Qy 


2821 


Db 


2821 


Qy 


2881 


Db 


2881 


Qy 


2941 


Db 


2941 


Qy 


3001 


Db 


3001 


Qy 


3061 


Db 


3061 


Qy 


3121 


Db 


3121 


Qy 


3181 


Db 


3181 



2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 252 0 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I II II I I I I II I I I I 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGT^ACTGTATTTTATTTTTTAA 2520 

ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

I II I II I I II I I I I I II I I I II II I I I I II I I I I I II II I I I I I II I I I I I II I I I I I II 
ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 258 0 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

I I I II II M M I I I I II I I II I II I M I I I II I I I I I I I I I I I I 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

I II M I I II I II I I I I I I I I I M II I I I I I I II I II M I I II I II I I I I II I II I II I I I 

AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 2760 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 

II II I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I II 

CACCTCCTATTCTCTTAATTTTTGTTA7WVTGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 

TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTCCCTTTTCCATATAGGA7\ACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAAAAATAATTACCCACA/iATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCA7UVG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCAGTATG7^CCTAACTCCCCACCCC7\ACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 
I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 
I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 40 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 



Ov 


3241 


Db 


3241 




3301 


Db 


3301 


Ov 

vy 


3361 


Db 


3361 


Ov 


3421 


Db 


3421 


Ov 


3481 


Db 


3481 


Ov 

^y 


3541 


Db 


3541 


0\7 




Db 


3601 


0\7 

wy 


3661 


Db 


3661 


0\7 

wy 




Db 


3721 


Ov 

wy 


3781 


Db 


3781 


Ov 

vy 


3841 


Db 


3841 


Ov 


3901 


Db 


3901 


Qy 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 



GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 
I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I N I 
GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGAC7y^.CCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 342 0 

I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 3480 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 
I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I M I I 
CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGATVATTGCCAGGT 3600 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGT7\AGATA 3660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I M I M M I I I I I I I N I I I I 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I M I I I I I I I I I I I I I I I 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 8 0 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M M I I I M 
CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATG7W\AAAATGCATTTTATAA 3900 

I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I M I M I I M I I I I I I I I I I I I I I I I I I I 
ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I I N I I I I I I I I I 
AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 408 0 



Qy 4 081 TAAAATAAAAGTTTACAGAT^CCTT 4105 

I I I I I M I I I I I I I I I I I I I I I I I I 
Db 4 081 TAAAATAAAAGTTTACAGAAACCTT 4105 



RESULT 4 
AAQ34583 



ID AAQ34583 standard; DNA; 4105 BP. 
XX 

AC AAQ34583; 
XX 

DT 25-MAR-2003 (revised) 

DT ll-MAY-1993 (first entry) 

XX 

DE ETa receptor gene. 
XX 

}<W Human; ETa; ETb; endothelin; receptor; transmembrane domain; N tail 

KW extracellular; cytoplasmic; C tail; post translational ; bovine; 

KW modification; ET-1 receptor; antagonist; circulatory system; ss. 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 485. .1768 

FT /*tag- a 

FT sig_peptide 485. .544 

FT /*tag= b 

FT mat_peptide 54 5. .17 65 

FT /*tag= c 

FT misc_feature 1972. .1976 

FT /^tag= e 

FT /function= "Related with mRNA instability" 

FT misc_feature 2059. .2063 

FT /*tag= f 

FT /function^ "Related with mRNA instability" 

FT misc_feature 2309. .2313 

FT /*tag= g 

FT /function^ "Related with mRNA instability" 

FT misc_feature 2386. .2390 

FT /*tag= h 

FT /function^ "Related with mRNA instability" 

FT misc_feature 2680. .2684 

FT /*tag= i 

FT /function^ "Related with mRNA instability" 

FT misc_feature 3252. .3256 

FT /*tag^ j 

FT /function= "Related with mRNA instability" 

FT misc_feature 3944. .3948 

FT /*tag= k 

FT /function^ "Related with mRNA instability" 

FT polyA_signal 4084. .4089 

FT /*tag= d 
XX 

PN EP522868-A1. 



XX 

PD 13-JAN-1993. 
XX 



PF lO-JUL-1992; 92EP-00306347 . 
XX 

PR 12-JUL-1991; 91JP-00172828 . 
XX 

PA (SHIO ) SHIONOGI SEIYAKU KK. 
XX 

PI Imura H, Nakao Nakanishi S; 
XX 

DR WPI; 1993-010677/02. 

DR P-PSDB; AAR30885. 
XX 

PT Human ETa and ETb endothelin receptors - for measuring endothelin and 

PT screening for endothelin antagonists. 

XX 

PS claim 6; Fig 1; 39pp; English. 
XX 

CC The sequences given in AAQ34583-84 encode the human ETa and ETb 

CC endothelin receptors respectively. ETa is a 427 amino acid protein with a 

CC molecular weight of 48,726. ETb comprises 442 amino acids and has a 

CC molecular weight of 49,629. ETa has a higher affinity for endothelin (ET) 

CC -1 and ET-2, whereas ETb has no selectivity for ET-1, ET-2 or ET-3. The 

CC receptors each contain seven transmembrane domains and have an 

CC extracellular N tail and a cytoplasmic C tail. There are several 

CC potential sites for post translational modification, these sites are 

CC identical to those of bovine ET-1 receptor. ETa cDNA is 91.2% homologous 

CC to bovine ET-1 receptor cDNA and ETb cDNA is 61.1% homologous to that of 

CC bovine ETa-receptor . The receptor proteins are useful as reagents for 

CC measuring the amount of ET or screening for antagonists of the ET 

CC receptor when studying the circulatory system. {Updated on 25-MAR-2003 to 

CC correct PN field.) 

XX 

SQ Sequence 4105 BP; 1138 A; 860 C; 844 G; 1263 T; 0 U; 0 Other; 

Query Match 100.0%; Score 4103.4; DB 2; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4104; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I 

GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 
I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I M I I I I I I I I I I I I I I I I I M 
AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 

CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACCATTGTGGAGAGGCGGTGGAGAGGCTT 180 

CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I M I I I I I I I I I I 

CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I M I I I M I I I 

GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 



Qy 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


JdU 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 


Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAA7\A 


/ion 




1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 


Qy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGC7^T7\AGAGATATTTCCTCAAATTTGCCT 


4 0 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


421 


AA7y\AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 


Qy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 


Qy 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 


Qy 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACT7VATTTGGTCCT 


660 




1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 


Qy 


661 


ACCCAGCAATGGCTC7\ATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 


Qy 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 N M 1 1 




Db 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGG7\ATGC 


780 


Qy 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


84 0 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


AACTCTGCTCAGGATCATTTACCAGAACT^AATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 


Qy 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 t 1 1 1 1 1 1 1 1 1 




Db 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 


Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 


Qy 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


102 0 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 


Qy 


1021 


T AGT GT T GACAGGT ACAGAG CAGT TGCCTCCT GGAGT CGT GT T C AG GGAAT T GG GATT C C 


t n Q n 
iUo U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


1080 


Qy 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 




Db 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 


Qy 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 


1200 



Db 


1141 


T GAAGC G ATT GGCT T C GT CAT GGT AC CCT T T GAAT AT Ab GG GT GAACAG LA i PJ\Pdv^ u 


1 9 n n 
X ^ u u 


Qv 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


1201 


TATGCTCAATGCCACATCAA7\ATTCATGGAGTTCTACCAAGATGTAAAGGACTGG i GGL i 


1 9 f^n 

J.Z DU 


Qv 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 




1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1 Q 0 n 


Ov 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 




1 1 i 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


T T GT GAGAT GT T GAACAGAAGGAAT GG C AGC T T GAGAAT T GC C CT C AGT GAACAT CTT AA 


1 o Q n 
Xo o U 


Ov 


1381 


GCAGCGTCGAGAAGTGGCAAAT^CAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


14 4 U 


Ov 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 


1500 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 M 1 1 1 1 1 M 1 1 1 




Db 


1441 


GTTCCCT CTT CACTTAAGCCGTATATT GAAGAAAACTGTGTATAACGAAAT GGACAAGAA 


1 R n n 


Ov 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTj^ACTTGGCAAC 


1560 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 




Db 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 




Ov 


1561 


CATGAATTCATGTATA7\ACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAA7VAATTG 


1620 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 




Db 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1 O A 

ibX U 


Ov 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCA7\AAGTCTGATGACCTCGGTCCC 


icon 
1 b o U 


Ov 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAA7\ACAACCACAACACAGACCG 


1740 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 




Db 


1681 


CAT GAACGGAACAAGCAT CCAGT GGAAGAACCACGAT CAAAACAACCACAACACAGACCG 


1 / 4 U 


Ov 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M t 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAG7\AGCACTCCTCGGTACTCCCAT 


1 Q n n 
I cf u u 


Ov 


1801 


AATCCTCTCGGAGTyWWVATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 




Db 


1801 


Ty^TCCTCTCGGAGAATWWVTCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 


Qv 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1920 




M 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 o bi 


r-Tirp^rprp r-Tiq^ a a TT r* n r'T r* pr* a r* a r* r* P a a A A n A A AT f^CTTT CC A AAACCGC A AGGT AGA 


1920 


Qy 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 


Db 


1921 


1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 


Qy 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I M i I I M I I I I I I I 



Db 


1981 


Qy 


2041 


Db 


2041 


Qy 


2101 


Db 


2101 


Qy 


2161 


Db 


2161 


Qy 


2221 


Db 


2221 


Qy 


2281 


Db 


2281 


Qy 


2341 


Db 


2341 


Qy 


2401 


Db 


2401 


Qy 


2461 


Db 


2461 


Qy 


2521 


Db 


2521 


Qy 


2581 


Db 


2581 


Qy 


2641 


Db 


2641 


Qy 


2701 


Db 


2701 


Qy 


2761 


Db 


2761 


Qy 


2821 


Db 


2821 



1981 TTCTGCGTGTTGTATTCAGCACTAAA7U\ATGGTGGGAGCTGGGGGAGAATG7^GACTGTT 2040 

AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I M I 

AAATGAAACCAGAAGGATATTTACTACTTTTGCATGA7U\ATAGAGCTTTCAAGTACATGG 2100 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I M I I I M M I I I I I I I I I 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGG7UVCTGGTCACCATGAAACTTTAG 2160 

AGATTAACGACTVAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 222 0 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I M M I I 
AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 222 0 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 2280 

I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 2280 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 2340 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTTiAAGCACAGTCTGATGACACA 2460 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACAC7WVTTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTTyii 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ill INN 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 252 0 

ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 
I I M I I I I I II II I I II I I I I I I I I I II I II I I I I II I I I I I I i I I I I I I I I I I I I I I N 
ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCTWU^GTAATGC 2580 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

M I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M II II I I I I I I I I I I I I I 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGT7WVTTTTGTATGA 2640 

AATVATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

I I I I I I II I I II I I I I I I I I I I II I I I I I I I I M I I I M I I I I I I M I I I I I I I I I I I I I 

AAAATCAATGTCAAGTACCA7WVTGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

I I II I I I I I I M I I I I II I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I 

TCAGTGCACTGTATATAGAAGTCTATVTVACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTTyVGTCTTTTTTGATCA 2 8 80 

I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 



Qy 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 


2940 


Db 


2881 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 II Mill 1 1 II 1 1 1 M 1 1 1 1 1 

TTCCCTTTTCCATATAGGAAACATAAl ill GAAbi GCjCCACjAI CjACjI i i Al UAltji ^alji 


^ -7 T U 


Qv 


2941 


GATVAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 


3000 




1 1 1 1 II 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 II 1 1 1 II 1 1 1 1 1 1 1 II 1 1 M 1 1 II 1 




Db 


2941 


GAAAAATAATTACCCACAAATGCCACCAGT/\ACTTAACGATTCTTCACTTCriOb(a(cri i i 


O VJ u u 


Qv 


3001 


TCAGTATGTUVCCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 


3060 




1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 II M II 1 1 M M II 1 1 1 1 1 1 1 1 1 1 1 




Db 


3001 


TCAGTATGAACCTAACTCCCCACCCCT^CATCTCCCTCCCACATTGTCACCAi i iCAAACj 


O u ou 


Ov 


3061 


GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 


3120 




II 1 II II II II II II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3061 


GGCCCACAGT GACTTTTGCTGGGCATTTT CCCAGAT GTTTACAGACT GT GAGTACAGCAG 




Qv 


3121 


AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 


3180 




1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 




Db 


3121 


AAAAT CT TT T ACT AGT GT GT GT GT GT AT AT AT ATAAACAATT GT AAAT T T CTT T TAG C CO 


o i o U 


Qv 


3181 


ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 


3240 




II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


3181 


ATTTTT CTAGACT GT CT CT GTGGAATAT ATTT GTGT GT GT GAT AT AT G CAT GT GT GTGAT 


4 U 


Ov 


3241 


GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 


3300 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


3241 


GGT AT GT AT G GAT TTAAT CT AAT CT7VAT7VAT T GT GC C C C GCAGT T GT G C CAAAGT GC AT A 


"3 "3 n n 
UU 


Ov 


3301 


GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 


3360 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3301 


GT CT GAGCT AAAAT CT AG GT GAT T GT T CAT CAT GACAAC CT G C CT C AGT C C AT TT TAACC 




Ov 


3361 


TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 


3420 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3361 


T GTAGC7\ACCTT CT GCATTCATAAAT CTT GTAAT CAT GTTACCATTAC7\AAT GGGATATA 


o4Z U 


Qv 


3421 


AGAGGCAGCGTGA7\AGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 


3480 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


3421 


AGAGGC AGCGT GAAAGCAGAT GAGCT GT G GACT AGCAAT AT AG G GTT T T GT T T G GT T GGT 


Q /I R n 


Qv 


3481 


TGGTTTGATAi^AGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 


3540 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


3481 


T GGT T T GATAAAGC AGTATTT GGGGT CAT AT T GTT T C CT GT GCT G GAG CAAAAGT C AT T A 


"3 R 4 n 


Qy 


3541 


CACTTTG7VAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 


3600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3541 


« -fi y-^m mm n TV j~tm Tv mm TV m tv mm /^mm/~<mm TV rn /*< /~* rp 7\ 7v rn rp tv TV rp /"rp /^rp f TV T* A A TV T' T' 7\ T" 

CACTTTGAAGTATTATATTGTTCTTATCCi LAAi i CAAi bl CjtjlUAi UAAAi i ijL-L-AtaLji 


o D U U 


Qy 


3601 


T GT CT GAT AT T T CT T T CAGACTT C G C CAGAC AGAT T GCT GAT AAT AAA i i AGG i AAGA 1 A 


Q /r /T 




II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3601 


TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 


3660 


Qy 


3661 


ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTG7VATTG 


3720 




1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3661 


ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 


3720 



Qy 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I 
Db 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

Qy 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 4 0 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

Qy 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 39 00 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGTVAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I 

Db 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

Qy 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

Qy 4021 AGTAACTTTGTAG7WVTGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

Qy 4 081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4081 TAAAATAA/^GTTTACAGAAACCTT 4105 



RESULT 5 




AAA38341 




ID 
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XX 
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KW 
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KW 
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XX 






OS 
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XX 






PN 
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XX 






PD 
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XX 






PF 


13-OCT-1999; 99WO-IB001678 . 




XX 






PR 
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PR 
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XX 






PA 


(EURO-) EURONA MEDICAL AB . 




XX 







PI Norberg LT, Andersson MK, Lindstrom PHR, Jonsson L; 
XX 

DR WPI; 2000-318010/27, 
XX 

PT Assessing cardiovascular status in humans involves comparing test 

PT polymorphic pattern comprising polymorphic positions within genes 

PT encoding specific proteins, with reference polymorphic pattern. 
XX 

PS Disclosure; Page 125-126; 126pp; English. 
XX 

CC The invention relates to a novel method of assessing the cardiovascular 

CC status in an individual and to newly identified polymorphisms in the 

CC genes encoding angiotensin-converting enzyme (ACE) , angiotensin II 

CC receptor type 1 (ATI) and type 2 (AT2), angiotensinogen (AGT) , renin, 

CC aldosterone synthase, endothelin receptor type A and beta-adrenergic 

CC receptors 1 and 2. The method comprises determining the sequence at one 

CC or more polymorphic positions within these genes, and comparing the 

CC pattern of polymorphisms from the individual with a reference polymorphic 

CC pattern obtained from a population of individuals exhibiting a 

CC predetermined cardiovascular disease status. The polymorphic markers are 

CC useful for determining the predisposition of an individual to 

CC cardiovascular disorders such as myocardial infarction, unstable angina, 

CC hypertension, atherosclerosis and stroke. They are also useful for 

CC predicting the likely cardiovascular status of a patient given a 

CC treatment regimen comprising administration of cardiovascular drugs 

CC (e.g., ACE inhibitors, beta-adrenergic receptor antagonists (beta- 

CC blockers) or calcium channel blockers). One or more polymorphic markers 

CC provides a basis for predicting the outcome of a treatment regimen. 

CC Fragments of the genes comprising a polymorphic site may be used as 

CC primers and probes for detecting genetic polymorphisms or in molecular 

CC library arrays for high throughput screening. The genes, and the proteins 

CC they encode are useful in the screening of potential cardiovascular 

CC drugs. Determination of an individual's polymorphic pattern reduces or 

CC eliminates trial and error in selecting a treatment for a particular 

CC individual cardiovascular patient. It also provides the ability to 

CC eliminate patients from clinical trials who are predicted to be non- 

CC responsive, or at a risk for an adverse response, to a particular 

CC treatment regimen. Adverse results in an early trial can be evaluated to 

CC identify polymorphic patterns so that the adverse results can be 

CC correlated with a sub-population of the test population, permitting 

CC exclusion of such sub-populations from the treatment group. Beneficial 

CC drugs can be approved for use in the appropriate population, thereby 

CC decreasing the number of patients required for a clinical trial, which in 

CC turn decreases the duration and cost of such trials. The present sequence 

CC represents the human endothelin receptor type A gene coding region 

CC (GenBank S57498) . The polymorphic sites identified are 969C/T, 1005A/G, 

CC 1146A/G and 2485T/C 

XX 

SQ Sequence 4105 BP; 1138 A; 859 C; 843 G; 1263 T; 0 U; 2 Other; 

Query Match 100.0%; Score 4103; DB 3; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4103; Conservative 0; Mismatches 2; Indels 0; Gaps 0 
Qy 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I M I I I I I I I I I I I I I M I M M I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I M I I 

Db 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 



Qy 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


ion 


Qy 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 1 1 1 1 M 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGi GGAbAbbUi i 


± o u 


Qy 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 




Db 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


Z 4 u 


Qy 


241 


GCAGTGCCCAGGT^AGTTTTCTGAAGCCGGGGT^GCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 n 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GCAGT GCC CAG GAAGTTT T CT GAAGC C G GGGAAG CT GT GCAG C C GAAG C C GC C GC C GCG C 


"3 n n 


Qy 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


"3 £^ n 


Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGT^AAA 


420 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 N 1 1 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


/too 
4zU 


Qy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 




1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


AAAAAGT GAAG GT GT AA7\AG CAG C AC AAGT G C AAT AAG AG AT AT T T C C T C AAAT T T G C CT 


H o U 


Oy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


481 


CAAGAT GGAAAC C CT T T GC CT C AG GGCAT COT TT T G GCT GGC ACT GGT T GGAT GT GTAAT 


d4 U 


Oy 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


CAGTGATAAT CCTGAGAGATACAGCACAAAT CTAAGCAAT CAT GT GGAT GATTT CACCAC 


bUU 


Qy 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


601 


TT T T C GT GG C AC AGAG CT CAG CTT C CT G GT T ACC ACT CAT CAAC C CACTAATT T GGT C CT 


bbU 


Qy 


661 


ACCCAGCAATGGCTCAATGCAC7\ACTATTGCCCACAGCAGACTA7\AATTACTTCAGCTTT 


720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


ACC C AGCAAT G GCT CAAT GCACAACT AT T GC C CAC AG C AGAC T AAAAT T ACTT C AG CTT T 


Ton 


Qy 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


CAT^ATACATTAACACTGTGATATCTTGTACl Ai 1 i i CAi CGi GGGAAi (jC^ i btjtjLrAAi 


7 fi n 


Qy 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGLCjU i GAl 


p /I n 

O 4 u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


AACTCTGCTCAGGATCATTTACCAGAAC7W\TGTATGAGGAATGGCCCC?ACGCGCTGAT 


840 


Qy 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 M 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATC7\ATGTATT 


900 



Qy 


901 


Db 


901 


Qy 


961 


Db 


961 


Qy 


1021 


Db 


1021 


Qy 


1081 


Db 


1081 


Qy 


1141 


Db 


1141 


Qy 


1201 


Db 


1201 


Qy 


1261 


Db 


1251 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 


Qy 


1441 


Db 


1441 


Qy 


1501 


Db 


1501 


Qy 


1561 


Db 


1561 


Qy 


1621 


Db 


1621 


Qy 


1681 


Db 


1681 


Qy 


1741 



TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACT^TGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I M I I I I I I I M I I I I I I I I I I I I M I I I 
TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I M I I I I M I M I I 

GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 
TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I M I I I I I I I I M I I I 

TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 
TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

M I I I M I M I I I I I I I I M I I I I I M I I I I I I I I I M I I I I I I I M I I I 

TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGT^CAGCATAAAACCTG 12 00 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGAAGCGATTGGCTTCGTCATGGTACCCTTTGTUVTATAGGGGTGAACAGCATAAAACCTG 12 00 

TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCTyVGATGTAAAGGACTGGTGGCT 12 60 

CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I M I I M I I I M I I I I I I 

CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 132 0 

TTGTGAGATGTTGT^CAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 138 0 

I M I I I M I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I M I I I I 

TTGTGAGATGTTGAACAGAANNAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 13 80 

GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 4 0 

I I I I I I I I I I I M I I M I I I I I I M I I I I I t I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 4 0 

GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA .1500 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I 

GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAT^ACTGTGTATAACGTWVTGGACAAGAA 1500 

CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTT^CTTGGCAAC 15 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I M I I I I I I 

CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1620 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I 

CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGA7VATTTAAAAATTG 1620 

TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I 

TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

CATG7UVCGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M M I I I I I I I N I 

CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 



Db 


1741 


GAGCAGC C ATAAGGACAG CAT GAACT GAG CAC C CTT AGAAGC ACT C CT C GGT ACT C C CAT 


1 Q n n 
1 0 U U 


Ov 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1801 


AATCCTCTCGGAG7\7^AAA7\ATCAC7^GGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


T o c n 
lb OU 


Ov 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCC7\AAACCGCAAGGTAGA 


1920 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1 n o ri 
1920 


Ov 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCT7\ATTTACATA 


1980 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1921 


CTGGTTTATCCACCCAC7VACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 


Ov 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 




Db 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAATUVTGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


204 0 


Ov 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAT^TAGAGCTTTCAAGTACATGG 


2100 




1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 


2100 


Ov 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCT^TGGGAACTGGTCACCATGAT^CTTTAG 


2160 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 


2160 


Ov 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 


2220 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 




Db 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 


2220 


Ov 


2221 


ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 


2280 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 




Db 


2221 


ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 


2280 


Ov 


2281 


TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAA7\AAAGACAAA 


2340 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2281 


T7\ATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAA7yWWWVGACAAA 


2340 


Ov 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTA7\A 


2400 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 


24 00 


Ov 


2401 


ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 


2460 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2401 


ACACAAAT T CT AAAG C T ACAAC AAAT ACT AC AGGC C CT TA7\AG C ACAGT CT GAT GACAC A 


2 4 DL) 


Ov 


2461 


TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 


2520 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


24ol 


rrtrvrrTT'TK /-rnrprpTv 7\m7\/-tAm/^rTim7v/-<mp7vA7\/"7\ aTTTTTT' A A P A 7\ PT/^T ATTTT ATTTTT T A A 
111 CjCjUACj 1 1 1 /\A.i o I i jTiS^ i U/\>\rV^Jr\/\I JL i -L 1 1 /\/iVj7/\rV*^ 1 o 1 r\x J. ± X ^1 1 X x X 1 J-\r\ 


2520 


Qy 


2521 


ATGGTGTTTTATTACAAGGGACCTTG7UVCATGTTTTGTATGTTAAATTCAAAAGTAATGC 


2580 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


2521 


ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 


2580 


Qy 


2581 


TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 


2640 



I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I M 



Db 


2581 


TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 


264 0 


Qy 


2641 


AAAATCAATGTCAAGTACCAAAATGTTAATbTATGTGTCAi i lAACTCTGCCi OAGAUi i 


97 no 




1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


2641 


AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 


2700 


Qy 


2701 


T CAGT GCACTGTATATAGAAGT CTAAAACACACCTAAGAGAAAAAGAT CGAATTTTTCAG 


97 (^n 

Z / D u 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 N 1 




Db 


2701 


TCAGTGCACTGTATATAG7\AGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 


2760 


Qy 


2761 


AT GAT T C GGAAATT T T C ATT C AGGT AT T T GTAAT AGT GAG AT AT AT AT GT AT ATACAT AT 


0 Q 0 n 

Z Cf ^1 u 




1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 




Db 


2761 


ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 


2820 


Qy 


2821 


C AC CT OCT AT T CT CTTAAT T TT T GT T AAAAT GT TAACT GGCAGTAAGT CT TT T T T GAT C A 


0 Q 0 n 
z 0 0 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 




Db 


2821 


CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 


2880 


Qy 


2881 


TTCCCTTTTC CAT AT AGGAAACAT AAT T T T GAAGT G GC C AGAT GAGT T TAT CAT GT CAGT 


0 0 /I n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 




Db 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 


2940 


Qy 


2941 


GAAAAAT AAT T ACC CACAAAT GC C ACC AGT AACT T7\AC GAT T CT T CACT T CTTGGGGTTT 


0 n n n 
^UUU 




1 1 1 1 1 1 1 1 1 1 1 1 1 M i 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M N 1 




Db 


2941 


GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 


3000 


Qy 


3001 


T CAGT AT GAAC CTAACT C CC CAC C C CAAC AT CT C C CT C C C ACAT T GT CAC C ATTT CAAAG 






1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


3001 


TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 


3060 


Qy 


3061 


GG C C C AC AGT GACT T TT GCT GGGCATT T T C C CAGAT GT T T AC AGACT GT GAGT AC AGC AG 


'3 n 0 n 
olZ U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 




Db 


3061 


GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 


3120 


Qy 


3121 


AAAAT CT T TT ACT AGT GT GT GT GT GT AT AT AT AT AAACAAT T GT AAAT T T CT T T T AGC C C 


ol 0 U 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


3121 


7\AAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTA7\ATTTCTTTTAGCCC 


3180 


Qy 


3181 


ATT T T T CT AGACT GT CT CT GT GGAAT AT ATT T GT GT GT GT GAT AT ATG CAT GT GT GTGAT 


0 /I n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


3181 


ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 


3240 


Qy 


3241 


GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGl GCCAAAGl GCAi A 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 




Db 


3241 


GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 


3300 


Qy 


3301 


__ __ _ — ^ , -n -n -n Tk m m TV y^m TV m m m TV m /"^ TV m TV /~* TV TV m rn TV TT TV TT rp rp rp TV TV 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGiCCAl i 1 lAACC 


"3 '3 n 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3301 


GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 


3360 


Qy 


3361 


J- ■-. ^m-n -p, « ,™ nmm m jr-* -r. mm y-i T\ m TV TV TV m /^rnm m TV TV m T\ rn rn m t\ TV rn rn TV TV TV TV rri tv rp tv rp TV 

T GT AGCAAC CTTCT GCAT T CAT AAAT CT T GTAAT CAT GT TAG CAT T ACAAA i Gb GA i A 1 A 






,1,1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 

1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 M 1 1 M M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 M 1 




Db 


3361 


TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 


3420 


Qy 


3421 


AGAGGCAGCGTGATUVGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 


3480 






1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 




Db 


3421 


AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 


3480 



TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I M M I I I M I I I I I I I M I i M I 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I M I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGT7UVGATA 3660 

II I I I I II II I I I I I I I I I I I II I II I I I II I I II I II I I I I I II I I I I I II I II 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I II II II I I 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTC7\AATCTATTATTCCACTGGCG 37 80 

I I I I II I I I I II II I I M I I I I I I II I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 
I I I.I I I I I I I II I I I I M II I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I 
CATCATATGCAGTGATATATGCCTATTVATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 40 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 39 00 

I I I I M I I I I II I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
ACAATTGTCTTTTTTTC7WVGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

ATTCAGA7\AGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M M I I I N I I I I I I I I I I I I I I II 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

T7\ACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 020 

AGTAACTTTGTAGAAATGAGCCAGTVAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4080 

I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I II I I I I I II I II I I I I I I II I 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 

T7W\ATAAAAGTTTACAGA7\ACCTT 4105 
I I I I I I I I I I I I I I I I I I I I II I I I 
TAAAATAAAAGTTTACAGAAACCTT 4105 



RESULT 6 
ACA56659 

ID ACA56659 standard; cDNA; 4079 BP. 
XX 

AC ACA56659; 
XX 

DT 06-JUN-2003 (first entry) 
XX 

DE Human signalling pathway polynucleotide probe SEQ ID NO 1257. 
XX 

KW Human; probe; ss; array element; Parkinson's disease; 



Ci\r 


3481 


Db 


3481 


yy 


3541 


Db 


3541 


yy 


j\j\j± 


Db 


3601 




O D O ± 




3661 


yy 


o / ^ ± 


Db 


3721 


yy 


o / O J. 


Db 


3781 


yy 


"^ft 4 1 
z>o H. ± 


Db 


3841 


yy 


o u J. 


Db 


3901 


yy 


O -3 O i. 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



KW signalling pathway population; cancer; adenocarcinoma; leukaemia; 

KW immunopathy; AIDS; asthma; neuropathy; TUzheimer's disease; microarray. 

XX 

OS Homo sapiens. 
XX 

PN US6500938-B1. 
XX 

PD 31-DEC-2002. 
XX 

PF 30-JAN-'1998; 98US-00016434 . 
XX 

PR 30-JAN-1998; 98US-00016434 . 
XX 

PA (INCY-) INCYTE GENOMICS INC. 
XX 

PI Au-Young J, Seilhamer JJ; 
XX 

DR WPI; 2003-352189/33. 
XX 

PT Combination of polynucleotide probes, useful as array elements in a 

PT microarray for monitoring the expression of a number of target 

PT polynucleotides . 
XX 

PS Claim 1; SEQ ID NO 1257; 65pp; English. 
XX 

CC The invention relates to a combination which, comprises a number of 

CC polynucleotide probes comprising a sequence selected from one of the 1490 

CC sequences mentioned in the specification. The combination is useful as an 

CC array element in a. microarray for monitoring the expression of a number 

CC of target polynucleotides. The microarray is particularly useful in the 

CC diagnosis and treatment of cancer and immunopathology and neuropathology. 

CC The microarray is useful in diagnostics and treatment regimens, drug 

CC discovery and development, toxicological and carcinogenicity studies, 

CC forensics and pharmacogenomics . The microarray is also useful for 

CC monitoring progression of diseases and for developing sophisticated 

CC profiles for the effects of currently available therapeutic drugs. The 

CC combination is also useful for purifying a subpopulation of mRNAs, cDNAs 

CC and genomic fragments and in research and diagnostic applications. The 

CC array can detect changes in expression in a large number of genes coding 

CC for different signaling pathway populations which can be used to diagnose 

CC various diseases including cancer e.g. adenocarcinoma and leukaemia, 

CC immunopathies e.g. AIDS and asthma, neuropathies e.g. Alzheimer's disease 

CC and Parkinson's disease. The present sequence represents a polynucleotide 

CC probe of the invention. Note: The sequence data for this patent did not 

CC form part of the printed specification but was obtained in electronic 

CC format directly from USPTO at 

CC seqdata . uspto . gov/sequence . html?DocID^06500938Bl 
XX 

SQ Sequence 4079 BP; 1125 A; 856 C; 842 G; 1256 T; 0 U; 0 Other; 

Query Match 99.4%; Score 4079; DB 7; Length 4079; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4079; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 5 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 64 

I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I M M I M I I I I I I I I I I I I I I I I I I I I 

Db 1 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 60 



65 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 124 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 11 I I I I I I I I I I I I I I I I M I I I I 

61 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 12 0 

125 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 184 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I 

121 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 18 0 

185 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAG 24 4 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGT^AGCAG 24 0 

245 TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 300 

305 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 364 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I M I I I I I I I I I I 

301 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 360 

365 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAA 424 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAATVA 420 

425 AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 4 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 AGTGAAGGTGTA7WVGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 4 80 

4 85 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 81 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 54 0 

545 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 604 

I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

541 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 600 

605 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

601 CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 660 

665 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 724 

I I I I I I I M I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAi^ATTACTTCAGCTTTCAAA 72 0 

725 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

721 TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGG7VATGCAACT 780 

7 85 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCT^ACGCGCTGATAGCC 844 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 840 

84 5 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 904 

I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

841 AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 900 



Qy 


905 


Db 


901 


Qy 


965 


Db 


961 


Qy 


1025 


Db 


1021 


Qy 


1085 


Db 


1081 


Qy 


1145 


Db 


1141 


Qy 


1205 


Db 


1201 


Qy 


1265 


Db 


1261 


Qy 


1325 


Db 


1321 


Qy 


1385 


Db 


1381 


Qy 


1445 


Db 


1441 


Qy 


1505 


Db 


1501 


Qy 


1565 


Db 


1561 


Qy 


1625 


Db 


1621 


Qy 


1685 


Db 


1681 


Qy 


1745 



CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I M I I I I I I I I I I I I I I I M I 
CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 960 

TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1024 

I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1020 

GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 1080 

GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I 

GTAACTGCCATTGATVATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 114 0 

GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 1204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I 

GCGATTGGCTTCGTCATGGTACCCTTTGTyVTATAGGGGTGAACAGCATAAAACCTGTATG 12 00 

CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 12 64 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 12 60 

GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1324 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I i I I I I I I I 

GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 132 0 

GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 138 4 

I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I 

GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 138 0 

CGTCGAG7VAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 1444 

I I I I I M I M i I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGTCGAGAAGTGGCA7\AAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 14 4 0 

CCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGA 1504 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

CCTCTTCACTTAAGCCGTATATTGAAGATVAACTGTGTATAACGAAATGGACAAGAACCGA 1500 

TGTGT^TTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1564 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M 
TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1560 

AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTC 1624 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I N 
AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTA/^TWVTTGTTTC 162 0 

CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1684 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1680 

AACGGAACAAGCATCCAGTGGT^GAACCACGATCAAAACAACCACAACACAGACCGGAGC 1744 

I M I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I 

AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 17 4 0 

17 45 AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATC 1804 



Db 


1741 


AGCCATA?VGGACAGCATGAACTGACCACCCTTAGAAGCAL i CCTCGGTAC I LOCAi AAi 


1 ft on 

X o u u 


Qv 


1805 


CTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTTC 


1864 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 




Db 


1801 


CT CTCGGAGAAAAAAAT CACAAGGCAACT GT GACT CC GGGAAT CT CTT CT CT GAT CCTTC 




Qv 


1865 


TTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTGG 


1924 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 




Db 


1861 


T T C CT T7\AT T C ACT C C C AC AC C CAAG7\AGA7^T GCTTT C CAAAAC C GCAAGG 1 AGAC i Otir 


J. 3^ z u 


Ov 


1925 


TTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCT 


1984 




1 1 1 M 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1921 


T TT AT C CAC CC ACAACAT CT AC GAAT CGTACT T CTT T AAT T GAT CT AAT T T ACAT ATT CT 


1 Q Q n 
1 y D u 


Ov 


1985 


GCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAAT 


2044 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1981 


GCGTGTT GTATT CAGCACTAAAAAAT GGTGGGAGCT GGGGGAGAAT GAAGACT GTT7W\.T 


o n /i n 
Z U4 U 


Ov 


2045 


GAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 


2104 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 M 




Db 


2041 


GAAAC C AGAAG GAT AT T TACT ACT T T T GCAT GAAAAT AGAGC T T T CAAGT ACAT GGCT AG 


Z lU U 


Ov 


2105 


CTTTTATGGCAGTTCTGGTGTUVTGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGAT 


2164 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


2101 


CT TT T AT GGCAGT T CT GGT GAAT GT T CAAT GGGAACT GGT CAC CAT GAAACT T T AGAGAT 


o 1 n 
Z 1 oU 


Qv 


2165 


TAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 


2224 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2161 


T AAC GACAAGATT T T CT ACTT T T T T TAAGT GAT TTTTTGTCCTT CAG C CAAACAC7VATAT 


o o o n 
ZzZ U 


Ov 


2225 


GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 


2284 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2221 


GGGCT CAGGT C ACT T T T ATT T GAAAT GT CAT T T GGT G C C AGT AT T TT T TTUVCT GCAT AAT 


o o Q n 


Ov 


2285 


AGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACA7VAAATA 


2344 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2281 


AGC CT AACAT GATT AT T T GAACT T AT T T AC ACAT AGT T T GAAAAAAAAAAGACAAAAAT A 


Z o4 u 


Qv 


2345 


GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACAC 


2404 




1 1 1 1 1 1 1 i 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 M 1 




Db 


2341 


GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTi i i iAAAACAC 


Z 4 u u 


Qv 


2405 


AAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTTG 


2464 




1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 




Db 


2401 


AAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGALACAi i iG 


Z DU 


Qy 


2465 


GCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATGG 


2524 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




DD 


o /I tf; 1 

ZH.01 


rr'ar-TTTAaTnr ATrTTar TP A A Af^ A ATTTTTT A AGAACTGTATTTTATTTTTTAAATGG 


2520 


QY 


2525 


TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGT7VATGCTTCA 


2584 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2521 


TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCA 


2580 


Qy 


2585 


ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATG7VAAAA 


2644 



I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I I I I I I I I I I I 



Db 


2581 


Qy 


2645 


Db 


2641 


Qy 


2705 


Db 


2701 


Qy 


2765 


Db 


2761 


Qy 


2825 


Db 


2821 


Qy 


2885 


Db 


2881 


Qy 


2945 


Db 


2941 


Qy 


3005 


Db 


3001 


Qy 


3065 


Db 


3061 


Qy 


3125 


Db 


3121 


Qy 


3185 


Db 


3181 


Qy 


3245 


Db 


3241 


Qy 


3305 


Db 


3301 


Qy 


3365 


Db 


3361 


Qy 


3425 


Db 


3421 



2581 ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATG7WWV 2640 

TCAATGTCAAGTACC7W\ATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 27 04 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

TCAATGTCAAGTACCA/iAATGTTTVATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 27 00 

TGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATGA 2764 

M I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I M 

TGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAT^GATCGAATTTTTCAGATGA 27 60 

TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 2824 

I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I 

TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 2 820 

TCCTATTCTCTTAATTTTTGTTAAAATGTT7UVCTGGCAGTAAGTCTTTTTTGATCATTCC 2884 

I I I I M I I I I I I I I I I I I I M M I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

TCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTCC 28 8 0 

CTTTTCCATATAGGAAACATAATTTTG7UVGTGGCCAGATGAGTTTATCATGTCAGTGAAA 2 944 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

CTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAAA 2940 

AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAG 3004 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I Ill 

AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAG 3000 

TATGAACCTAACTCCCCACCCCT^ACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 3064 

i I I I I I I M I I I I I II I I II I I I II I I I I I I I I M I I I I I I I I II I II I I I I II I I I I I I 

TATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 3060 

CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGTWyV 3124 

I I I I I I I I I I I II II I I I II I II II II I II I I I II I I II I I I I I I I I I II II I I I I I II I 

CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGA7\AA 3120 

TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 318 4 

I I I I I I I I I I M I II I I II I I II II II I II I I I I II I II I I I II I I I I I I II I II II II I 

TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 318 0 

TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 3244 
I I I I I I I I I I M I I I I I II I I I I II II I I I I II I II I M I I I I I II I I I I I I M I I M II 
TTCTAGACTGTCTCTGTGG7\ATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 32 4 0 

TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3304 

i I I I I I I I I I I I I I II I I II I I I I I I I I M I I I I I I I I I I M II II I I I I I I I I I I II II 

TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3300 

GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 3364 
I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I M M I I I I I I I I M M II 
GAGCTAATVATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTT^CCTGTA 3360 

GCAACCTTCTGCATTCAT7WVTCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 3424 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M II I I I I I I I I I I M I I II 
GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 3420 

GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 84 
I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I M I I I I I I I M I I I I I I I I I I I I I I II 
GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 80 



Qy 


3485 


TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 


3544 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3481 


TTGATAAAGCAGTATTTGGGGTCATAi ibi i iLCibibulbOAbOAAAACaiUAi i/\L,i\ux 


~j -J "-i \j 


Qy 


3545 


TTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 


3604 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


3541 


TTGAAGTATTATATTOTTCTTATCCTCAAriuAAiblGblbAibAAAi KjUUAbbi ibn^ 




Qv 


3605 


TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATTT 


3664 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3601 


TGATATTTCTTTCAGACTTCGCCAGACAGAT i GLibAlAAiAAAi iA(j(jlAA(jAiAA.i i i 


J D O 


OV 


3665 


GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAG 


3724 




1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 1 1 1 1 i 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 M 




Db 


3661 


GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCT IGAAi 1 CjCAACj 


o / Z U 


Qv 


3725 


GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 


3784 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M i 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3721 


GCTAAGAAGTACT GCCCTTTT GT GTGTTAGCAGT CAAAT CT ATT ATT CCACT GGCGCATC 


"3 1 Q n 


Ov 


3785 


ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 


3844 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 M M 




Db 


3781 


AT AT GCAGT GATATATGCCT ATAAT ATAAGCCATAGGTT CACACCATTTT GTTTAGACAA 


1 p /I n 


Qv 


3845 


TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAA7WVAATGCATTTTATAAATTC 


3904 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


3841 


T T GT C T T T T T T T CAAGAT G C T T T GT T T CT T T CAT AT GAAAAAAAT GC AT T T TAT AAAT T C 


o J u u 


Ov 


3905 


AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 


3964 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


3901 


AGAAAGTCATAGATTTCTGT^AGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 


3960 


Qy 


3965 


TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 


4024 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


3961 


TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 


4020 


Qy 


4025 


ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 4 083 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


4021 


ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA ' 


1079 



RESULT 7 
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ID 
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AC 
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XX 




DT 


08-MAY-2002 (first entry) 


XX 




DE 
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XX 




KW 
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KW 
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XX 




OS 
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XX 
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XX 
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XX 
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XX 
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XX 

PA (BGHM ) BRIGHAM & WOMENS HOSPITAL INC. 
XX 
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XX 

DR WPI; 2002-179967/23. 

DR P-PSDB; AAU84272. 
XX 

PT Diagnosing endometrial cancer comprises determining expression of nucleic 

PT acid molecules or expression products that are differentially expressed 

PT in normal and malignant endometrium. 
XX 

PS Claim 1; Page 60-62; 233pp; English. 
XX 

CC The invention relates to diagnosing endometrial cancer in a subject 

CC suspected of having endometrial cancer comprising determining the 

CC expression of a set of nucleic acid molecules or expression products in 

CC an endometrial sample suspected of being cancerous, where the set of 

CC nucleic acid molecules comprises at least 2 nucleic acid molecules 

CC selected from 50 fully defined sequences as given in the specification. 

CC The nucleic acids are used as an array of at least 2 of the 50 nucleic 

CC acids bound to a solid substrate. Also included is a solid-phase protein 

CC microarray comprising at least 2 antibodies or its antigen binding 

CC fragments, that specifically bind at least 2 different polypeptides from 

CC the 50 fully defined sequences as given in the specification, fixed to a 

CC solid substrate. The methods and arrays are useful for the diagnosis of 

CC endometrial cancer, selecting and monitoring treatment regimes and 

CC identification of lead compounds useful for the treatment of endometrial 

CC cancer. The present sequence is one of 50 genes differentially expressed 

CC between cancerous and non-cancerous samples 

XX 

SQ Sequence 2595 BP; 788 A; 478 C; 459 G; 870 T; 0 U; 0 Other; 

Query Match 60.2%; Score 2470; DB 6; Length 2595; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2481; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 



Qy 



1624 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 1683 




Db 



15 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 74 



Qy 



Db 



1684 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 174 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

75 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 134 



Qy 



1744 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 1803 




Db 



135 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGT^GCACTCCTCGGTACTCCCATTVAT 194 



Qy 



1804 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGTVATCTCTTCTCTGATCCTT 18 63 



Db 


195 


CCTCTCGGAGAAAAAAATCACT^AGGCAACTGTGACTCCGGGAATCTCTTCTCTGAJ. Cui i 


Z O *i 


Ov 


1864 


CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTG 


1923 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 I 




Db 


255 


CT T C CTT AATT CACT C C CACAC C CAAGAAGAAAT GCT T T C C7\AAAC C GCAAGGT AGACTG 


O 1 H 


Ov 


1924 


GTTTATCCACCCACT^ACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 


1983 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


315 


GTT T AT C CACC CACAACAT CT AC GAAT C GT ACT T C T TT AAT T GAT CT AAT TT AC AT ATT C 




Ov 


1984 


TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 


2043 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


375 


TGCGTGTTGTATTCAGCACTAAAATVATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 




Ov 


2044 


TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 


2103 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


435 


TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 




Ov 


2104 


GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 


2163 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 




Db 


495 


GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 


554 


Ov 


2164 


TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 


2223 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 




Db 


555 


TT7\ACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 


614 


Ov 


2224 


TGGGCTCAGGTCACTTTTATTTGATUVTGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 


2283 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 




Db 


615 


TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 


67 4 


Ov 
vy 


2284 


TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG7W\AAAAAAAGACAA7\AAT 


2343 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


675 


TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAA7WW^.GACAAAAAT 


/34 


Ov 
vy 


2344 


AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 


2403 




1 1 1 1 1 1 1 1 U 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


735 


AGT AT T C AGGTGAGC7VAT T AGATT AGT AT T T T CC ACGT C ACT ATTT AT T TT TTT AAAACA 


/ y 4 


Ov 

vy 


2404 


CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 


2463 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


795 


CAAATTCT7UVAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 


854 


Ov 
^y 


2464 


GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 


2523 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 N 1 1 




Db 


855 


G GCAGTT T AAT AGAT GT TACT CAAAG7VAT T T TTTAAGAACT GT AT T T T AT TTTT T AAAT G 


Q 1 /I 

y 14 


Qv 


2524 


GTGTTTTATTAC7VAGGGACCTTGAACATGTTTTGTATGTTAAATTCAA7\AGTAATGCTTC 


2583 


Db 


y lb 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


974 


Qy 


2584 


AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAA 


2643 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


975 


AATCAGATAGTTCTTTTTCACAAGTTC7\AT-CTGTTTTTCATGTAAATTTTGTATGAAAA 


1033 


Qy 


2644 


ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 


2703 



I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I 



Db 


1034 


Qy 


2704 


Db 


1094 


Qy 


2764 


Db 


1154 


Qy 


2824 


Db 


1214 


Qy 


2884 


Db 


1274 


Qy 


2944 


Db 


1334 


Qy 


3004 


Db 


1394 


Qy 


3064 


Db 


1454 


Qy 


3124 


Db 


1514 


Qy 


3184 


Db 


1574 


Qy 


3244 


Db 


1634 


Qy 


3304 


Db 


1694 


Qy 


3364 


Db 


1754 


Qy 


3424 


Db 


1814 


Qy 


3484 


Db 


1874 



1034 ATC7^ATGTCAAGTACCAAAATGTT7\ATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 1093 

GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGJ^AAAAGATCGAATTTTTCAGATG 27 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I 

GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 1153 

ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 1213 

CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 2883 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I N I I I I I 

CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 1273 

CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 2943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I 

CCTTTTCCATATAGGT^CATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 1333 

TWVTAATTACCCACATVATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 3003 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I 

AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 1393 

GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 3063 

I I I I I I I M I I 11 I I I I I I I I I I I I I I I I I I I I I M I M I I I I N I I I I I I I I I I I I I I I 

GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 1453 

CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 3123 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M M i I I I M I I I 

CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 1513 

ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 3183 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I N I 
ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 1573 

TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 3243 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I 

TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 1633 

ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 3303 

I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 1693 

TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 3363 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 17 53 

AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATT^AGA 3423 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I 

AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACA/iATGGGATATAAGA 1813 

GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 34 83 

I I I I I M I M I I I I I I I I I I I I I M I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I M I 

GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 1873 
TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 3543 

M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I M I I I I I I 

TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 1933 



Qv 


3544 


TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 


3603 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M M M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1934 


TTT GAAGT ATT ATAT T GT T CT T AT COT CAAT TCAAT GT GGT GAT G7\AATT GC C AGGTT GT 


1 Q Q "5 

± y y sJ 


Qv 


3604 


CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 


3663 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1994 


CT GAT ATT T CT T T C AGACT T C GC CAGAC AGATT GCT GAT AATAAAT T AGGTAAGATAAT T 


0 n ^ 


Ov 


3664 


TGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAA 


3723 




1 1 1 1 1 I 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


2054 


TGTTGGGCCATATTTTAGGACAGGTAA7\ATAACATCAGGTTCCAGTTGCTTGAATTGCAA 




Ov 


3724 


GGCTAAG7\AGTACTGCCCTTTTGTGTGTTAGCAGTCA7\ATCTATTATTCCACTGGCGCAT 


3783 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


2114 


GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 


21/3 


Ov 


3784 


CATATGCAGTGATATATGCCTAT7iATAT7\AGCCATAGGTTCACACCATTTTGTTTAGACA 


3843 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


2174 


CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 


o o o o 

2233 


Ov 


3844 


ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 


3903 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1-1 1 




Db 


2234 


ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 


2293 


Ov 


3904 


CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 


3963 




1 1 1 1 1 1 1 1 1 1 1 II II 1 1 II 1 1 1 II 1 1 II M 1 1 1 1 1 1 1 M 1 II II 1 1 1 1 1 1 M 1 1 II 1 II 1 




Db 


2294 


C AGAAAGTC AT AGAT T T CT GAAG GC GTCAAC GT GCAT T TT AT T T AT GGACT GGTAAGTAA 


o o c o 
Z3d3 


Ov 


3964 


CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 


4023 




1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 II II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


2354 


CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 


2413 


Qy 


4024 


AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 


4083 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2414 


AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTT^ 


2473 


Qy 


4084 


AATAAAAGTTTACAGAAACCTT 4105 




Db 


2474 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

AATAAAAGTTTACAG/^CCTT 2495 





RESULT 8 
AAL39858 

ID AAL39858 standard; DNA; 2595 BP. 
XX 

AC 7^39858; 
XX 

DT 05-SEP-2002 (first entry) 
XX 

DE Human allergy-associated gene SEQ ID No 30. 
XX 

KW Antiallergic; allergic disease; carboxypeptidase M; cathepsin C; CYPlBl; 

KW endoserine A receptor; osteoblast-specif ic factor 2; DD96; gene therapy; 

KW bronchial asthma; human; ds . 
XX 

OS Homo sapiens. 



XX 

PN WO200252006-A1. 
XX 

PD 04-JUL-2002. 
XX 

PF 21-DEC-2001; 2 OOlWO- JP0112 87 . 
XX 

PR 26-DEC-2000; 2000 JP-00396166 . 
XX 

PA (GENO-) GENOX RES INC. 
XX 

PI Ohtani N, Matsui K, Yoshida N, Sugita Y, Izuhara K; 
XX 

DR WPI; 2002-500763/53, 
XX 

PT Examining allergic diseases by changes in expression levels of six 

PT allergy-associated genes inducible by stimulation e.g. of airway 

PT epithelia cells with interleukin-4 or 13, also applicable in screening 

PT compounds . 

XX 

PS Disclosure; Page 79-80; 106pp;, Japanese. 
XX 

CC The invention relates to a novel method for examining allergic diseases, 

CC comprising determining the expression level of a gene selected from 

CC carboxypeptidase M, cathepsin C, endoserine A receptor, osteoblast- 

CC specific factor 2, DD96 and CYPlBl in the biological sample from a 

CC patient, and comparing the expression level with that in the sample of a 

CC healthy individual. The polynucleotides of the invention can be used to 

CC treat disorders by gene therapy. The method is useful for examining 

CC allergic diseases particularly bronchial asthma and its diagnosis, which 

CC is also applicable in screening candidate compounds for remedies. This 

CC polynucleotide sequence represents a human allergy-associated gene of the 

CC invention 

XX 

SQ Sequence 2595 BP; 788 A; 478 C; 459 G; 870 T; 0 U; 0 Other; 

Query Match 50.2%; Score 2470; DB 6; Length 2595; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2481; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 



Qy 


1624 


CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCC7\A7\AGTCTGATGACCTCGGTCCCCAT 


1683 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


15 


CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 


74 


Qy 


1684 


GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCAC7VACACAGACCGGAG 


1743 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M M 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


75 


GAACGGAACAAGC ATC CAGT GGAAGAAC CACGAT CAAAACAACCACAACACAGACC GGAG 


134 


Qy 


1744 


CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 


1803 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


135 


CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 


194 


Qy 


1804 


CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 


1863 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


195 


CCTCTCGGAGAATWW^TCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 


254 


Qy 


1864 


CTTCCTTAATTCACTCCCACACCCAAGAAG7\AATGCTTTCCAAAACCGCAAGGTAGACTG 


1923 



Db 


255 


Ov 

wy 


1924 


Db 


315 


Ov 


1984 


Db 


375 


wy 


2044 


Db 


435 


wy 


^ X u *± 


Db 


495 




^ X vJ *i 


Db 


555 




222 4 


Db 


615 


wy 


^ ^ u ^ 


Db 


675 


wy 


9^4 4 

O 1 1 




735 


vy 


94 04 

jI. ^ 1 


Db 


795 


wy 


2464 


Db 


855 


wy 


2524 


Db 


915 


Ov 


2584 


Db 


975 


Qy 


2644 


Db 


1034 


Qy 


2704 



I M I I I I I I I I I I I I I I M M I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M M 

CTTCCTTAATTCACTCCCACACCCAAGAAGA/UVTGCTTTCCAAAACCGCAAGGTAGACTG 314 

GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 1983 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

GTTTATCCACCCACAACATCTACGAATCGTACTTGTTTAATTGATCT7\ATTTACATATTC 374 

TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 2 04 3 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGT^GACTGTTAAA 4 34 

TGAAACCAGAAGGATATTTACTACTTTTGCATGA7WVTAGAGCTTTCAAGTACATGGCTA 2103 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I 

TGAAACCAG7\AGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 4 94 

GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 2163 
I I I I I I I I I I I I I I I I I I I I I M I M I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 554 

TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 222 3 

I M I M I I I I I I I I I I I I I I I I I M I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 614 

TGGGCTCAGGTCACTTTTATTTG7VAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 2283 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I M I I 

TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 674 

TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAATUW^GACAAAAAT 234 3 

I I I I I I I M I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG7W\AAAAAAAGACAA7WVT 734 

AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 24 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 7 94 

CAAATTCTAAAGCTACAACA7UVTACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 24 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I 

CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTA7\AGCACAGTCTGATGACACATTT 854 

GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 2523 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I M I I I I M I M I I I 

GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 914 

GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I 

GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAA7UVGTAATGCTTC 97 4 

AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA7VAA 2643 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGTW^A 1033 

ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 27 03 

I I I I I I M I I I I I I M I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I 
ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 1093 

GTGCACTGTATATAGT^GTCTAATUVCACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 27 63 

I I I M I I I I I I I I I I I I M I M I I I I I I I I I I I I I I M I I I I M M I I I I I I I I I I I I I I 



Db 


1094 


Qy 


2764 


Db 


1154 


Qy 


2824 


Db 


1214 


Qy 


2884 


Db 


1274 


Qy 


2944 


Db 


1334 


Qy 


3004 


Db 


1394 


Qy 


3064 


Db 


1454 


Qy 


3124 


Db 


1514 


Qy 


3184 


Db 


1574 


Qy 


3244 


Db 


1634 


Qy 


3304 


Db 


1694 


Qy 


3364 


Db 


1754 


Qy 


3424 


Db 


1814 


Qy 


3484 


Db 


1874 


Qy 


3544 


Db 


1934 



1094 GTGCACTGTATATAGAAGTCTAAAACACACCTT^AGAGAAAAAGATCGTUVTTTTTCAGATG 1153 

ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2823 

I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 1213 

CTCCTATTCTCTTAATTTTTGTTAAT^TGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 2883 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I M M I I M I N I 

CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 1273 

CCTTTTCCATATAGGAAACATAATTTTGT^GTGGCCAGATGAGTTTATCATGTCAGTGAA 2943 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I M I I I I I 

CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 1333 

AAATAATTACCCAC7W^TGCCACCAGTAACTT7\ACGATTCTTCACTTCTTGGGGTTTTCA 3003 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 1393 

GTATGAACCTAACTCCCCACCCCT^CATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 3063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I 

GTATGAACCT7\ACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 1453 

CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 3123 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 1513 

ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 3183 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I 
ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 1573 

TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 3243 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 1633 

ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 33 03 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

ATGTATGGATTTTVATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 1693 

TGAGCTATVAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 3363 
I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M 
TGAGCT7W\ATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 17 53 

AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 3423 

I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I 

AGCAACCTTCTGCATTCAT7WVTCTTGTAATCATGTTACCATTACA7\ATGGGATATAAGA 1813 

GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCTyVTATAGGGTTTTGTTTGGTTGGTTGG 34 83 

I M I I I I I I I I I I I I I I I I I I I I I M M I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I 

GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 1873 

TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 3543 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
TTTGATATUVGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 1933 

TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 3603 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I M I I I I I I I I I 
TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 1993 



Qy 3604 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATATU^TTAGGTAAGATAATT 3663 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I II I I I I I 

Db 1994 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 2053 

Qy 3664 TGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTG7\ATTGCAA 3723 

I II I II I I I I I II M I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I II II II I 

Db 2054 TGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAA 2113 

Qy 3724 GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 37 83 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II II I I II I I I I I 

Db 2114 GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 2173 

Qy 37 84 CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 3843 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 217 4 CATATGCAGTGATATATGCCTATAATAT7VAGCCATAGGTTCACACCATTTTGTTTAGACA 2233 

Qy 38 4 4 ATTGTCTTTTTTTC7\AGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 3903 

I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2234 ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 2293 

Qy 3904 CAGAAAGTCATAGATTTCTG7\AGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 3963 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I 
Db 22 94 CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 2353 

Qy 3964 CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 4023 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I 
Db 2354 CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAAC7VAGT 2413 

Qy 4024 AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 4 083 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2414 AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 2 473 

Qy 4084 AATAAAAGTTTACAGAAACCTT 4105 

II I I I I I I I I I I I I I I I I I I II 

Db 247 4 AATAAAAGTTTACAGAAACCTT 2 4 95 
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XX 

PT Novel polynucleotide of the endothelin/endothelin converting 

PT enzyme/receptors of endothelin and endothelin converting enzyme signaling 

PT system associated with cardiovascular disease, useful for treating the 

PT disease. 

XX 

PS Claim 1; Page; 190pp; English. 
XX 

CC The invention describes a polynucleotide (I) of the endothelin 

CC (EDN) /endothelin converting enzyme ( ECE) /receptors of EDN and ECE (EDNR) 

CC signaling system which is associated with a cardiovascular disease. (I), 

CC the gene encoding EDN, ECE or EDNR (II) or a vector (III) expressing (I) 

CC or (II) is useful for producing cells capable of expressing a molecular 

CC variant polypeptide which is associated with a cardiovascular disease. 

CC (II), (III), the EDN, ECE or EDNR polypeptide, or a cell expressing a 

CC molecular variant gene comprising (I) is useful for identifying and 

CC obtaining a pro-drug or drug capable of modulating the activity of a 

CC molecular variant of a polypeptide of the EDN/EDNR/ECE signaling system 

CC or its gene product, or for identifying and obtaining an inhibitor of the 

CC activity of a molecular variant of a polypeptide of the EDN/EDNR/ECE 

CC signaling system or its gene product. The isolated proteins and 

CC polynucleotides encoding them are useful for preparation of a 

CC pharmaceutical composition for treating a cardiovascular disease such as 

CC coronary heart disease, hypertension, atherosclerosis, or related to 

CC abnormal angiogenesis or fatty acid metabolism e.g. diabetes and familial 

CC hypercholesterolaemia. The gene or a polynucleotide fragment of the 

CC EDN/ECE/EDNR signaling system are useful as forensic markers, for 

CC creating a transgenic animal and in creation of a solid support 

CC comprising polynucleotides, genes, vectors, polypeptides, antibodies or 

CC host cells of the invention. This sequence encodes the cardioavscular 

CC regulator Endothelin receptor A (EDNRA) . Note: This sequence does not 

CC appear in the specification but has been obtained from GenBank using 

CC information given in the invention 

XX 

SQ Sequence 2595 BP; 788 A; 478 C; 459 G; 870 T; 0 U; 0 Other; 



Query Match 60.2%; Score 2470; DB 6; Length 2595; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2481; Conservative 0; Mismatches 0; Indels 1; Gaps 



1 



Qy 1624 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 1683 

I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M M I I N 

Db 15 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 7 4 

Qy 1684 GTy^CGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACTyVCCACAACACAGACCGGAG 17 43 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 75 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 134 

Qy 174 4 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 1803 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 135 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 194 

Qy 18 04 CCTCTCGGAG7WWWVTCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 18 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 195 CCTCTCGGAGAAATVAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 254 

Qy 1864 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCC7VAAACCGCAAGGTAGACTG 1923 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I M I I M 

Db 2 55 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTG 314 

Qy 1924 GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 1983 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I 

Db 315 GTTTATCCACCCACAACATCTACGTVATCGTACTTCTTTAATTGATCTAATTTACATATTC 374 

Qy 1984 TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT7\AA 2043 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 375 TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 434 

Qy 2044 TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 2103 

I I I M I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 35 TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 494 

Qy 2104 GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 2163 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 4 95 GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 554 

Qy 2164 TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCA7\ACACAATA 2223 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I M I I I 

Db 555 TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 614 

Qy 2224 TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 2283 

I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 615 TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 674 

Qy 2284 TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGA7V7\AAAAAAAGACAAAAAT 2343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 67 5 TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAAT 734 

Qy 2344 AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 24 03 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 735 AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 794 

Qy 2404 CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 24 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 795 CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 854 



Qy 24 64 GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 2523 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 855 GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 914 

Qy 2524 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTC7\AAAGTAATGCTTC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 915 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTC 974 

Qy 2584 AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAA 2643 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 975 AATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGAAAA 1033 

Qy 2 644 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 27 03 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1034 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 1093 

Qy 27 04 GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 2763 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1094 GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGj\ATTTTTCAGATG 1153 

Qy 2764 ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2823 

I I I I I I I I I I I I I M I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1154 ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 1213 

Qy 2 824 CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 28 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 1214 CTCCTATTCTCTTAATTTTTGTTAAAATGTT7\ACTGGCAGT7\AGTCTTTTTTGATCATTC 127 3 

Qy 28 84 CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGi^A 2943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I M I I I I I 

Db 1274 CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 1333 

Qy 2 944 AAATAATTACCCACTWVTGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 3003 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1334 AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 1393 

Qy 3004 GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTC7\7\AGGGC 3063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I M I M 
Db 1394 GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 14 53 

Qy 3064 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 312 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1454 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 1513 

Qy 312 4 ATCTTTTACTAGTGTGTGTGTGTATATATATAT^CAATTGTAAATTTCTTTTAGCCCATT 3183 

I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1514 ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 1573 

Qy 3184 TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 32 43 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I M I I 

Db 1574 TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 1633 

Qy 3244 ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 3303 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 1634 ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCATU^GTGCATAGTC 1693 



Qy 



3304 TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 3363 







1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 




Db 


1694 


TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 


1753 


Qy 


3364 


AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1754 


AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 


1813 


Qy 


3424 


GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1814 


GGCAGCGTGT^AAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 


1873 


Qy 


3484 


TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 


3543 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 N 1 1 1 




Db 


1874 


TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 


1933 


Qy 


3544 


TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 


3603 




1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1934 


TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 


1993 


Qy 


3604 


CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 


3663 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 M 1 




Db 


1994 


CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 


2053 


Qy 


3664 


TGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAA 


3723 




1 i 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 




Db 


2054 


TGTTGGGCCATATTTTAGGACAGGT7VAAATAACATCAGGTTCCAGTTGCTTG7\ATTGCAA 


2113 


Qy 


3724 


GGCT7VAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 


3783 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 >■■■■■■■>>■<■<*■■ ■ 




Db 


2114 


GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 


2173 


Qy 


3784 


CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 


3843 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2174 


CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 


2233 


Qy 


3844 


ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTAT7\AATT 


3903 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


2234 


ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAA7W\ATGCATTTTATAAATT 


2293 


Qy 


3904 


CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 


3953 






1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i M 1 1 1 1 1 




Db 


2294 


CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 


2353 


Qy 


3964 


CTGTGGTTTACTAGCAGGT^TATTTCCAATTTCTACCTTTACTACATCTTTTCTUVCAAGT 


4023 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2354 


CTGTGGTTTACTAGCAGGAATATTTCC7\ATTTCTACCTTTACTACATCTTTTCAACAAGT 


2413 


Qy 


4024 


AACTTTGTAGAi\ATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 


4083 






1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


2414 


AACTTTGTAGAAATGAGCCAGAAGCCTVAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTT^ 


2473 


Qy 


4084 


AATAAAAGTTTACAGAAACCTT 4105 




Db 


2474 


1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 

AATAAAAGTTTACAGAAACCTT 24 95 





RESULT 10 



AAA34793 

ID AAA34793 standard; DNA; 1868 BP. 
XX 

AC AAA34793; 
XX 

DT 28-JUL-2000 {first entry) 
XX 

DE Human adenosine receptor related polynucleotide SEQ ID NO: 24 82. 
XX 

KW Human; adenosine receptor; low adenosine antisense oligonucleotide; 

KW phosphorothioate; impaired respiration; inflammation; allergy; 

KW allergic disease; bronchoconstriction; inhibitor; antiinflammatory; 

KW antiallergic; antiasthmatic; cytostatic; analgesic; impaired airway; 

KW lung disease; ischaemic condition; pulmonary vasoconstriction; asthma; 

KW respiratory distress syndrome; pain; cystic fibrosis; emphysema; 

KW pulmonary hypertension; chronic obstructive pulmonary disease; COPD; 

KW cancer; leukaemia; lymphoma; carcinoma; metastasis; ss. 

XX 

OS Homo sapiens. 
XX 

FN WO200009525-A2. 
XX 

PD 24-FEB-2000. 
XX 

PF 03-AUG-1999; 99WO-US0177 12 . 
XX 

PR 03-AUG-1998; 98US-00952 12P . 
XX 

PA (UYEC-) UNIV EAST CAROLINA. 
XX 

PI Nyce JW; 
XX 

DR WPI; 2000-205971/18. 
XX 

PT New antisense oligonucleotides useful for treating e.g. pulmonary 

PT vasoconstruction, inflammation, allergies, asthma, hypertension, 

PT bronchitis, emphysema, respiratory distress syndrome, ischemia or 

PT cancers , 
XX 

PS Disclosure; Page 645-646; 1343pp; English. 
XX 

CC The present invention describes a new composition comprising an antisense 

CC oligonucleotide (ON) with low adenosine (up to 15%), which targets 

CC nucleic acids involved in bronchoconstriction, allergies, and/or 

CC inflammation. The ON can have antiinflammatory, antiallergic, 

CC antiasthmatic, cytostatic and analgesic activities. The compositions are 

CC useful for the treatment of diseases associated with inflammation, 

CC impaired airways, including lung disease and diseases whose secondary 

CC effects afflict the lungs of a subject. They can be used for treating 

CC e.g. ischaemic conditions, pulmonary vasoconstriction, allergies, asthma, 

CC impeded respiration, respiratory distress syndrome, pain, cystic 

CC fibrosis, pulmonary hypertension, emphysema, chronic obstructive 

CC pulmonary disease (COPD), and cancers such as leukaemias, lymphomas, 

CC carcinomas, and cancers which may metastasise to the lungs, including 

CC breast and prostate cancer. The reduction of the adenosine content of the 

CC ONs reduces side effects. The A-containing ONs break down with the 

CC release of deoxyadenosine which activates adenosine receptors causing 



CC bronchoconstriction and inflammation. 7W\.32313 to AAA35312 represent the 
CC . nucleotide sequences given in the sequence listing from the present 

CC invention, which correspond to SEQ ID N0:1 to 2815, and then the last 185 

CC sequences are also called SEQ ID N0:1 to 185, but the sequences differ 

CC from the previously named sequences. SEQ ID NO: 11 to 1680 (A7\A32323 to 

CC AAA33992) are specifically claimed ONs from the present invention. N.B. 

CC Sequences given in the disclosure of the present invention do not match 

CC up with their corresponding SEQ ID NO: sequences given in the sequence 

CC listing 
XX 

SQ Sequence 1868 BP; 512 A; 419 C; 389 G; 548 T; 0 U; 0 Other; 

Query Match 44.3%; Score 1819.6; DB 3; Length 1868; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 184 4; Conservative 0; Mismatches 4; Indels 2; Gaps 2; 

Qy 421 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10 AAA7\AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 69 

Qy 481 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I 

Db 70 CAAGATGG7WVCCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 12 9 

Qy 541 CAGTGATAATCCTGAGAGATACAGCACA7\ATCTAAGCAATCATGTGGATGATTTCACCAC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 130 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 18 9 

Qy 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I M I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I M I I I I I I I I I I I I M 

Db 190 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 24 9 

Qy 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 250 ACCCAGCAATGGCTC7\ATGCAC7^CTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 309 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 78 0 

I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I 1 I I I I I I I I I I I I I I I I I I 

Db 310 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 369 

Qy 781 7\ACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 370 AACTCTGCTCAGGATCATTTACCAG7\ACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 42 9 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 430 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 48 9 

Qy 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 490 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCAC7\ATGACTTTGGCGTATTTCTTTGCAA 54 9 

Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 550 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 609 



Qy 1021 



TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 







1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


610 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


669 


Qy 


1081 


TTTGGT7\ACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCC i GGCLAl 1 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


670 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


729 


Qy 


1141 


T G7\AGC GAT T GGCT T C GT CAT GGTACC CT T T GAATAT AGGGGT GAAC AGO AT AAAAC CT G 


1 9 n n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


730 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGT^TATAGGGGTGAACAGCATAAAACCTG 


789 


Qy 


1201 


T AT GCT CAAT G CC AC AT CAAAAT T C AT GGAGT T CT AC C7\AGAT GT AAAG GACT GGT GGCT 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


790 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


849 


Qy 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


-1 Q o n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


850 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


909 


Qy 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


toon 
loo U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 M 1 1 1 1 1 1 1 




Db 


910 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


969 


Qy 


1381 


GCAGCGTCGAG7\AGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


T /I /I n 
144U 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


970 


GCAGCGTCGAG7VAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1029 


Qy 


1441 


GT T C C CT CTT CACT T7\AGC C GT AT AT T GAAGAAAACT GT GT AT AAC GAAAT G GACAAGAA 


"1 c; n n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1030 


GTTCCCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAGATGGACAAGAA 


1089 


Qy 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1090 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCT^C 


1149 


Qy 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGC7U\GAAATTTAAAAATTG 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1150 


CATG7UVTTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1209 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1210 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1269 


Qy 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCAC7VACACAGACCG 


1 / 4 U 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 




Db 


1270 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1329 


Qy 


1741 


GAG CAGC C AT AAGGAC AGC AT G7\ACT GAC CACC CTT AGAAGC ACT C CT C G GT AC 1 C L CA i 


T Q n n 




1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1330 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1389 


Qy 


1801 


AATCCTCTCGGACjAAAAAAAI UAL./\/\(crCjU/\/\L- 1 (j1 uu^^^/\/-vi \^n^ii»^-n^-L 


1860 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1390 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGAGTCCGGGAATCTCTTCTCTGATC 


1449 


Qy 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAi^AACCGCAA-GGTAG 


1919 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 





Db 



1450 



CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGGTAG 1509 



Qy 1920 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTT7\ATTGATCTAATTTACAT 197 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1510 ACTGGTTTATCCACCCAC7\ACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 1569 

Qy 1980 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 2039 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 1570 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 1629 

Qy 2 040 TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 2099 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1630 TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 168 9 

Qy 2100 GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 2159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1690 GCTAGCTTTTATGGCAGTTCTGGTG7\ATGTTCAATGGGAACTGGTCACCATGAAACTTTA 174 9 

Qy 2160 GAGATT7\ACGACAAGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACA 2218 

I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1750 GAGATTAACGACTVAGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACA 1809 

Qy 2219 CAATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 2268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1810 CAATATGGGCTCAAGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 1859 



RESULT 11 


AAA34781 


ID 


AAA34781 standard; DNA; 1868 BP. 


XX 




AC 


AAA34781; 


XX 




DT 


28-JUL-2000 (first entry) 


XX 




DE 


Human adenosine receptor related polynucleotide SEQ ID NO: 2470. 


XX 




KW 


Human; adenosine receptor; low adenosine antisense oligonucleotide; 


KW 


phosphorothioate; impaired respiration; inflammation; allergy; 


?CW 


allergic disease; bronchoconstriction; inhibitor; antiinflammatory; 


KW 


antiallergic; antiasthmatic; cytostatic; analgesic; impaired airway; 


KW 


lung disease; ischaemic condition; pulmonary vasoconstriction; asthma; 


KW 


respiratory distress syndrome; pain; cystic fibrosis; emphysema; 


KW 


pulmonary hypertension; chronic obstructive pulmonary disease; COPD; 


KW 


cancer; leukaemia; lymphoma; carcinoma; metastasis; ss. 


XX 




OS 


Homo sapiens. 


XX 




PN 


WO200Q09525-7V2. 


XX 




PD 


24-FEB-2000. 


XX 




PF 


03-AUG-1999; 99WO-US017712 . 


XX 




PR 


03-AUG-1998; 98US-0095212P . 


XX 




PA 


(UYEC-) UNIV EAST CAROLINA. 



XX 

PI Nyce JW; 
XX 

DR WPI; 2000-205971/18. 
XX 

FT New antisense oligonucleotides useful for treating e.g. pulmonary 

FT vasoconstruction, inflammation, allergies, asthma, hypertension, 

FT bronchitis, emphysema, respiratory distress syndrome, ischemia or 

FT cancers . 
XX 

FS Disclosure; Page 606-607; 1343pp; English. 
XX 

CC The present invention describes a new composition comprising an antisense 

CC oligonucleotide (ON) with low adenosine (up to 15%), which targets 

CC nucleic acids involved in bronchoconstriction, allergies, and/or 

CC inflammation. The ON can have antiinflammatory, antiallergic, 

CC antiasthmatic, cytostatic and analgesic activities. The compositions are 

CC useful for the treatment of diseases associated with inflammation, 

CC impaired airways, including lung disease and diseases whose secondary 

CC effects afflict the lungs of a subject. They can be used for treating 

CC e.g. ischaemic conditions, pulmonary vasoconstriction, allergies, asthma, 

CC impeded respiration, respiratory distress syndrome, pain, cystic 

CC fibrosis, pulmonary hypertension, emphysema, chronic obstructive 

CC pulmonary disease (COPD) , and cancers such as leukaemias, lymphomas, 

CC carcinomas, and cancers which may metastasise to the lungs, including 

CC breast and prostate cancer. The reduction of the adenosine content of the 

CC ONs reduces side effects. The A-containing ONs break down with the 

CC release of deoxyadenosine which activates adenosine receptors causing 

CC bronchoconstriction and inflammation. AAA32313 to 7VAA35312 represent the 

CC nucleotide sequences given in the sequence listing from the present 

CC invention, which correspond to SEQ ID N0:1 to 2815, and then the last 185 

CC sequences are also called SEQ ID N0:1 to 185, but the sequences differ 

CC from the previously named sequences, SEQ ID NO: 11 to 1680 (AAA32323 to 

CC AAA33992) are specifically claimed ONs from the present invention. N.B. 

CC Sequences given in the disclosure of the present invention do not match 

CC up with their corresponding SEQ ID NO: sequences given in the sequence 

CC listing 

XX 

SQ Sequence 1868 BP; 512 A; 419 C; 389 G; 548 T; 0 U; 0 Other; 

Query Match 44.3%; Score 1819.6; DB 3; Length 1868; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 1844; Conservative 0; Mismatches 4; Indels 2; Gaps 2 
Qy 421 AAAT^GTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 




Db 



10 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 69 



Qy 



481 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 






Db 



70 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 129 



Qy 



Db 



541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

130 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGC7\ATCATGTGGATGATTTCACCAC 18 9 



Qy 



601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 



Db 190 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 249 

Qy 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 72 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 250 ACCCAGCT^TGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 309 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 310 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 369 

Qy 781 AACTCTGCTCAGGATCATTTACCAG7VACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 37 0 AACTCTGCTCAGGATCATTTACCAGAACA7\ATGTATGAGGAATGGCCCCAACGCGCTGAT 42 9 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I 

Db 430 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATC7\ATGTATT 489 

Qy 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 490 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 54 9 

Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 550 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 609 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

I I I I I I I I I M I I M I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I M I I I I I 

Db 610 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 669 

Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 67 0 TTTGGTAACTGCCATTG7WVTTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 729 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 1200 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 730 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 789 

Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 
Db 790 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 84 9 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I i I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 850 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 909 

Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 13 80 

M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 910 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTTU^ 969 

Qy 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 97 0 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 102 9 

Qy 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1030 GTTCCCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAGATGGACAAGAA 1089 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGC7VAC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 1090 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 114 9 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAATVAATTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1150 CATGAATTCATGTATTWVCCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 12 09 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1210 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 12 69 

Qy 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 1270 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1329 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I 

Db 1330 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1389 

Qy 1801 AATCCTCTCGGAGAAAAAAATCAC7\AGGCAACTGTGACTCCGGG7UVTCTCTTCTCTGATC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1390 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGAGTCCGGGAATCTCTTCTCTGATC 14 4 9 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCC7\AAACCGCAA-GGTAG 1919 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1450 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGGTAG 1509 

Qy 192 0 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 197 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1510 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 1569 

Qy 198 0 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 2039 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1570 ATTCTGCGTGTTGTATTCAGCACTTVAATVAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 1629 

Qy 204 0 TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 2099 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1630 TAAATGAAACCAGTW^GGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 1689 

Qy 2100 GCTAGCTTTTATGGCAGTTCTGGTG7\ATGTTCAATGGGAACTGGTCACCATGAAACTTTA 2159 

I M I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1690 GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 174 9 

Qy 2160 GAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACA 2218 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1750 GAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACA 1809 

Qy 2219 CAATATGGGCTCAGGTCACTTTTATTTG7VAATGTCATTTGGTGCCAGTAT 2268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1810 CAATATGGGCTCAAGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 1859 



RESULT 12 
AAF20915 



ID AAF20915 standard; DNA; 1868 BP. 
XX 

AC AAF20915; 
XX 

DT 14-MAR-2001 (first entry) 
XX 

DE Human endothelin receptor A polynucleotide fragment #24 82. 
XX 

KW Low adenosine antisense oligonucleotide; phosphorothioate; allergy; 

KW human; airway disorder; bronchoconstriction; lung inflammation; 

KW surfactant depletion; respiratory; bronchodilator ; antiinflammatory; 

KW immunosuppressive; antiasthmatic; analgesic; hypotensive; cytostatic; 

KW respiratory obstruction; pulmonary obstruction; impeded respiration; 

KW surfactant hypoproduction; pulmonary vasoconstriction; asthma; RDS; 

KW respiratory distress syndrome; pain; cystic fibrosis; allergic rhinitis; 

PCW pulmonary hypertension; emphysema; pulmonary transplantation rejection; 

KW chronic obstructive pulmonary disease; pulmonary infection; bronchitis; 

KW cancer; ss. 

XX 

OS Homo sapiens . 
XX 

PN WO200062736-A2. 
XX 

PD 26-OCT-2000. 
XX 

PF 24-MAR-2000; 2000WO-US00802 0 . 
XX 

PR 06-APR-1999; 99US-0127 958P . 
XX 

PA (UYEC-) UNIV EAST C7VR0LINA. 

PA (NYCE/) NYCE J W. 

XX 

PI Nyce JW; 
XX 

DR WPI; 2000-679539/66. 
XX 

PT Low adenosine (A) content antisense oligonucleotides which do not trigger 

PT adenosine receptors during metabolism, useful e.g. for treating cancers 

PT and respiratory obstructions. 
XX 

PS Disclosure; Page 244; 1592pp; English. 
XX 

CC The present invention describes low adenosine (A) content antisense 

CC oligonucleotides and compositions (I) comprising them. In the antisense 

CC oligonucleotides the A is replaced by a 'Universal' or alternative base. 

CC (I) can have respiratory, bronchodilator, antiinflammatory, analgesic, 

CC immunosuppressive, antiasthmatic, hypotensive and cytostatic activities. 

CC The antisense oligonucleotides and (I) can be used to down-regulate the 

CC expression and or activity of target polypeptides associated with 

CC lung/respiratory disorders and malignancies, such as stimulating and 

CC activating peptide factors and transmitters, transcription factors, 

CC immunoglobulins and antibodies, antibody receptors, cytokines and 

CC chemokines, endogenously produced specific and non-specific enzymes, 

CC binding proteins, adhesion molecules and their receptors, cytokine and 

CC chemokine receptors, adenosine receptors, bradykinin receptors, central 

CC nervous system (CNS) and peripheral nervous and non-nervous system 

CC receptors, CNS and peripheral nervous and non-nervous system peptide 



CC transmitters, defensins, growth factors, vasoactive peptides and 

CC receptors, binding proteins and malignancy associated proteins. The 

CC antisense oligonucleotides may be used in this way to treat disorders 

CC including respiratory obstruction (especially pulmonary obstruction 

CC and/or bronchoconstriction) and/or lung inflammation, allergy(ies) and/or 

CC surfactant hypoproduction which are associated with a disease or 

CC condition selected from pulmonary vasoconstriction, inflammation, 

CC allergies, asthma, impeded respiration, respiratory distress syndrome 

CC (RDS), pain, cystic fibrosis (CF) , allergic rhinitis (AR) , pulmonary 

CC hypertension, emphysema, chronic obstructive pulmonary disease (COPD) , 

CC pulmonary transplantation rejection, pulmonary infections, bronchitis, 

CC and/or cancer. AAF18434 to AAF21543 represent human polynucleotide 

CC fragments and antisense oligonucleotides used in the exemplification of 

CC the present invention 

XX 

SQ Sequence 1868 BP; 512 A; 419 C; 389 G; 548 T; 0 U; 0 Other; 



Query Match 44.3%; Score 1819.6; DB 3; Length 1868; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 1844; Conservative 0; Mismatches 4; Indels 2; Gaps 2; 



yy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 




1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


10 


AAATyVGTGAAGGTGTAAAAGCAGCACAAGTGC^ATAAGAGATATTTCCTCAAATTTGCCT 


69 


wy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


70 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


129 


Qy 


541 CAGTGATAATCCTGAGAGATACAGCACATVATCTAAGCAATCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


130 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


189 


Qy 


6.01 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


190 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


249 


Qy 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


250 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


309 


Qy 


721 


CAAAT ACAT T AACACT GT GATAT CTT GT ACT ATTTT CAT CGTGGGAAT GGT GGGGAAT GC 


780 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


310 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


369 


Qy 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 




1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 




Db 


370 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


429 


Qy 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 M 




Db 


430 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


489 


Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 




1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


490 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


549 



Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 609 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 610 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 669 

Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

I I I I I I I I I I I I hi I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 670 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 729 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAA7\ACCTG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 730 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATATVAACCTG 78 9 

Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 790 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 84 9 

Qy 12 61 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 132 0 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 850 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 909 

Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 910 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 9 69 

Qy 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 144 0 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 970 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1029 

Qy 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 

Db 1030 GTTCCCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAGATGGACj^AGAA 1089 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1090 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 114 9 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTTUVAAATTG 1620 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1150 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1209 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1210 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1269 

Qy 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 17 4 0 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 127 0 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1329 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I M I 

Db 1330 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 138 9 



Qy 



1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 1390 AATCCTCTCGGAGAAAAAAATCACAAGGC7\ACTGTGAGTCCGGGAATCTCTTCTCTGATC 144 9 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCC7\AG7\AGAAATGCTTTCCAAAACCGCAA-GGTAG 1919 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1450 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGGTAG 1509 

Qy 1920 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 197 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1510 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 1569 

Qy 198 0 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 2039 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1570 ATTCTGCGTGTTGTATTCAGCACT7\AAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 1629 

Qy 2040 TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 2099 

I M I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 1630 TAAATG7\AACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 1689 

Qy 2100 GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 2159 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I 
Db 1690 GCTAGCTTTTATGGCAGTTCTGGTG7UVTGTTCAATGGGAACTGGTCACCATGAAACTTTA 17 4 9 

Qy 2160 GAGATTAACGACTUVGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACA 2218 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I i I 

Db 1750 GAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACA 18 09 

Qy 2219 CAATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 2268 

I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I 

Db 1810 CAATATGGGCTCAAGTCACTTTTATTTG7WVTGTCATTTGGTGCCAGTAT 1859 



RESULT 13 
AAF20903 

ID AAF20903 standard; DNA; 1868 BP. 
XX 

AC AAF2 0903; 
XX 

DT 14-MAR-2001 {first entry) 
XX 

DE Human low adenosine antisense oligonucleotide #2470. 
XX 

KW Low adenosine antisense oligonucleotide; phosphorothioate; allergy; 

KW human; airway disorder; bronchoconstriction; lung inflammation; 

KW surfactant depletion; respiratory; bronchodilator ; antiinflammatory; 

KW immunosuppressive; antiasthmatic; analgesic; hypotensive; cytostatic; 

KW respiratory obstruction; pulmonary obstruction; impeded respiration; 

KW surfactant hypoproduction; pulmonary vasoconstriction; asthma; RDS; 

KW respiratory distress syndrome; pain; cystic fibrosis; allergic rhinitis; 

KW pulmonary hypertension; emphysema; pulmonary transplantation rejection; 

KW chronic obstructive pulmonary disease; pulmonary infection; bronchitis; 

KW cancer; ss. 

XX 

OS Homo sapiens. 
XX 

PN WO200062736-A2. 
XX 



PD 26-OCT-2000. 
XX 

PF 24-MAR-2000; 2000WO-US008020 . 
XX 

PR 06-APR-1999; 99US-0127958P . 
XX 

PA (UYEC-) UNIV EAST CAROLINA. 

PA (NYCE/) NYCE J W. 

XX 

PI Nyce JW; 
XX 

DR WPI; 2000-679539/66. 
XX 

PT Low adenosine (A) content antisense oligonucleotides which do not trigger 

PT adenosine receptors during metabolism, useful e.g. for treating cancers 

PT and respiratory obstructions. 
XX 

PS Disclosure; Page 676; 1592pp; English. 
XX 

CC The present invention describes low adenosine (A) content antisense 

CC oligonucleotides and compositions (I) comprising them. In the antisense 

CC oligonucleotides the A is replaced by a 'Universal* or alternative base. 

CC (I) can have respiratory, bronchodilator , antiinflammatory, analgesic, 

CC immunosuppressive, antiasthmatic, hypotensive and cytostatic activities. 

CC The antisense oligonucleotides and (I) can be used to down-regulate the 

CC expression and or activity of target polypeptides associated with 

CC lung/respiratory disorders and malignancies, such as stimulating and 

CC activating peptide factors and transmitters, transcription factors, 

CC immunoglobulins and antibodies, antibody receptors, cytokines and 

CC chemokines, endogenously produced specific and non-specific enzymes, 

CC binding proteins, adhesion molecules and their receptors, cytokine and 

CC chemokine receptors, adenosine receptors, bradykinin receptors, central 

CC nervous system (CNS) and peripheral nervous and non-nervous system 

CC receptors, CNS and peripheral nervous and non-nervous system peptide 

CC transmitters, defensins, growth factors, vasoactive peptides and 

CC receptors, binding proteins and malignancy associated proteins. The 

CC antisense oligonucleotides may be used in this way to treat disorders 

CC including respiratory obstruction (especially pulmonary obstruction 

CC and/or bronchoconstriction) and/or lung inflammation, allergy (ies) and/or 

CC surfactant hypoproduction which are associated with a disease or 

CC condition selected from pulmonary vasoconstriction, inflammation, 

CC allergies, asthma, impeded respiration, respiratory distress syndrome 

CC (RDS), pain, cystic fibrosis (CF) , allergic rhinitis (AR) , pulmonary 

CC hypertension, emphysema, chronic obstructive pulmonary disease (COPD) , 

CC pulmonary transplantation rejection, pulmonary infections, bronchitis, 

CC and/or cancer. AAF18434 to AAF21543 represent human polynucleotide 

CC fragments and antisense oligonucleotides used in the exemplification of 

CC the present invention 

XX 

SQ Sequence 1868 BP; 512 A; 419 C; 389 G; 548 T; 0 U; 0 Other; 

Query Match 44.3%; Score 1819.6; DB 3; Length 1868; 
Best Local Similarity 99.7%; Pred. No. 0; 

Matches 1844; Conservative 0; Mismatches 4; Indels 2; Gaps 2; 

Qy 421 AAAAAGTGAAGGTGTAAAAGCAGCACTVAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 
I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 



Db 



10 AAAAAGTGT^GGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 69 



Qy 481 CAAGATGG7WVCCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 0 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTT^AT 12 9 

Qy 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 130 CAGTGATAATCCTGAGAGATACAGCACTiAATCTAAGCAATCATGTGGATGATTTCACCAC 18 9 

Qy 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I 

Db 190 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 24 9 

Qy 661 ACCCAGCAATGGCTCAATGCAC7VACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 72 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M 

Db 250 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 309 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGG7\ATGGTGGGGAATGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 310 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 369 

Qy 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCTVACGCGCTGAT 84 0 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 37 0 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGT^TGGCCCCAACGCGCTGAT 42 9 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 90 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 430 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 48 9 

Qy 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCAC7\ATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 90 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 54 9 

Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 550 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 60 9 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I M I I I I 

Db 610 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 669 

Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 67 0 TTTGGT7\ACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 72 9 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGT^CAGCATAAAACCTG 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 730 TG7\AGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 78 9 

Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I I I I M I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 790 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 84 9 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 850 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 909 



Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I 

Db 910 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 969 

Qy 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I 

Db 97 0 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1029 

Qy 14 41 GTTCCCTCTTCACTTAAGCCGTATATTGAAGA7WVCTGTGTATAACG7\AATGGACAAGAA 15 00 

II I II I I I II I I I I I I I I II I M I I I I I I II I I I I I I I I I I I I I II I I 

Db 1030 GTTCCCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAGATGGACAAGAA 10 89 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I II I I II I I I I I I I II I I M I I I I II I I I I I II II I I I I II I I I I II I I I II II I M I I 

Db 1090 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1149 

Qy 1561 CATGAATTCATGTATTWVCCCCATAGCTCTGTATTTTGTGAGCT^GAT^TTTAAAAATTG 1620 

I I II I I II I I I I I I I II I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I I II I I I I I 

Db 1150 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1209 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I 

Db 1210 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 12 69 

Qy 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 17 40 

I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I II I I I I I I I I I I I I M I I I II 

Db 1270 CATGTVACGGAACAAGCATCCAGTGGAAGAACCACGATCAAT^CTyVCCACAACACAGACCG 1329 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 1330 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1389 

Qy 18 01 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1390 AATCCTCTCGGAGAAAAAAATCACAAGGC7\ACTGTGAGTCCGGGAATCTCTTCTCTGATC 1449 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAA-GGTAG 1919 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1450 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGGTAG 1509 

Qy 1920 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 1979 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1510 ACTGGTTTATCCACCCAC7UVCATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 15 69 

Qy 198 0 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 2 039 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1570 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 1629 

Qy 204 0 TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 2 099 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1630 TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 1689 

Qy 2100 GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 2159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 169 0 GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 1749 



Qy 



2160 GAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACA 2218 





Db 



1750 GAGATT7\ACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACA 1809 



Qy 



Db 



2219 CAATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 2268 

I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
1810 CAATATGGGCTCAAGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 1859 



RESULT 14 
ABZ96609 

ID ABZ96609 standard; DNA; 1868 BP. 
XX 

AC ABZ96609; 
XX 

DT 17-OCT-2003 (first entry) 
XX 

DE Human endothelin receptor A nucleic acid. 
XX 

KW Human; antisense; lung dysfunction; nasal airway dysfunction; 

KW antiinflammatory steroid; ubiquinone; antiinflammatory; antiallergic; 

KW antiasthmatic; hypotensive; immunosuppressive; cytostatic; gene therapy; 

KW antisense gene therapy; respiratory; lung; adenosine sensitivity; 

KW adenosine receptor; bronchodilation; bronchoconstriction; lung allergy; 

KW lung inflammation; respiratory disease; ds . 



OS Homo sapiens. 
XX 

PN WO200285308-A2. 
XX 

PD 31-OCT-2002. 
XX 

PF 23-APR-2002; 2 002WO-US0 13135 . 
XX 

PR 24-APR-2001; 2001US-0286137P . 
XX 

PA (EPIG-) EPIGENESIS PHARM INC. 
XX 

PI Nyce JW, Li Y, Sandrasagra A^ Katz E, Pabalan J, Aguilar D; 

PI Miller S, Tang L^ Shahabuddin S; 

XX 

DR WPI; 2003-229219/22. 
XX 

PT Pharmaceutical composition for treating ailments associated with impaired 

PT respiration, has oligo(s) antisense to specific gene(s) or its 

PT corresponding RNAs, and glucocorticoid or non-glucocorticoid steroid or 

PT ubiquinone . 

XX 

PS Disclosure; SEQ ID NO 11851; 872pp; English. 
XX 

CC The invention relates to a novel pharmaceutical composition, which has a 

CC first active agent comprising an oligonucleotide antisense to the 

CC initiation codon, coding region, 5' or 3 * end genomic flanking regions, 

CC 5* and 3' intron-exon junctions, or regions within 2-10 nucleotides of 

CC junctions of genes encoding a polypeptide associated with lung and/or 

CC nasal airway dysfunction and a second active agent comprising an 

CC antiinflammatory steroid and ubiquinone. A composition of the invention 



XX 



CC has antiinflainmatory, antiallergic, antiasthmatic, hypotensive, 

CC immunosuppressive, and cytostatic activity. The composition may have a 

CC use in antisense gene therapy. The composition is useful for treating or 

CC preventing a respiratory, lung or malignant disease or condition, also 

CC for enhancing the prophylactic or therapeutic respiratory effect of an 

CC antiinflammatory steroid in a subject, for reducing or depleting levels 

CC of, or reducing sensitivity to adenosine, reducing levels of adenosine 

CC receptor, producing bronchodilation, increasing levels of ubiquinone or 

CC lung surfactant in a subject's tissue, or treating bronchoconstriction, 

CC lung inflammation, lung allergies, or a respiratory disease or condition. 

CC Note: The sequence data for this patent is not represented in the printed 

CC specification, but was obtained in electronic format directly from WIPO 

CC at ftp.wipo.int/pub/published_pct_sequences 
XX 

SQ Sequence 1868 BP; 512 A; 419 C; 389 G; 548 T; 0 U; 0 Other; 

Query Match 44.3%; Score 1819.6; DB 7; Length 1868; 

Best Local Similarity 99.7%; Fred. No. 0; 

Matches 184 4; Conservative 0; Mismatches 4; Indels 2; Gaps 2 



Qy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCATVATTTGCCT 


480 




1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


10 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


69 


Qy 


4 81 


CT^GATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 i 1 1 1 1 1 1 1 1 i 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


70 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


129 


Qy 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCT^TCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


130 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


189 


Qy 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 I.I 1 1 1 1 1 1 1 1 




Db 


190 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


249 


Qy 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 




II 1 1 II 1 1 II 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 II 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 




Db 


250 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


309 


Qy 


721 


CAAATACATTTVACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 




1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


310 


CAAATACATTTVACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


369 


Qy 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 




1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


370 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


429 


Qy 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


430 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


489 


Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 




II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


490 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


549 



Qy 



961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 



I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 550 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 609 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 610 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 669 

Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 67 0 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 72 9 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGTVATATAGGGGTGAACAGCATAAAACCTG 12 00 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I 

Db 730 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 789 

Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I II M II I II I I I I II I I II I I I I II I I I I I II I I II II M I I I I I I I II I M I I I II I 
Db 790 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGT7WVGGACTGGTGGCT 849 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I II I M II I I I I I I I II I II I II I I I I I I I I I I II I II I II I I I I I I I II I II II I I II 

Db 850 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 90 9 

Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGi^ACATCTTAA 13 8 0 

II II I I I I II I I II I II I I I I I I I I I I I I I I M I I I I I 1 I I I I I I I I I I II II I II I I I I 

Db 910 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTTVA 969 

Qy 1381 GCAGCGTCGAGT^GTGGCTVAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 4 0 

I M I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I M I I I I I I M II 

Db 97 0 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 102 9 

Qy 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGA/sAACTGTGTATAACGAAATGGACAAGAA 1500 

I II II I II I I II I I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I M I I I I I I I I I 

Db 1030 GTTCCCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAGATGGACAAGAA 1089 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCT^C 1560 

II I I I I I I I I I I I I I II I I I I I II I II I II I I I I I I I I I I I II I I II I I I I I I I I I I I I I 

Db 1090 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 114 9 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 162 0 

I II I I I II I I I I I II I I II I I I I I I I I I M I II II I I II I I I I I II I I I II I I I I I I II I 
Db 1150 CATGAATTCATGTATATVACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1209 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

I I I I I I I I II II I I I I II I I I I I I I I I I II I I II I I I I I II I I I I II I I II I I I I II I I I 
Db' 1210 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 12 69 

Qy 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATC7\AAACAACCACAACACAGACCG 17 4 0 

I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I II I I I I 
Db 1270 CATGT^ACGGTUVCAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1329 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

I I I I I I I I I I I II I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I 
Db 1330 GAGCAGCCATAAGGACAGCATGT^CTGACCACCCTTAGTyVGCACTCCTCGGTACTCCCAT 1389 

Qy 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

I I I I I I I II I I II I II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I II 



Db 



1390 AATCCTCTCGGAGAAAAAAATCACAAGGC7\ACTGTGAGTCCGGGAATCTCTTCTCTGATC 144 9 



Qy 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCTiAAACCGCAA-GGTAG 


1919 




■ llltlllllllillllllllllllllllllllllllllllllltJIIIIIIII lllll 

1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 lllll 




Db 


1450 


CTT CT T C CTT AAT T C ACTC C CAC AC CCAAGAAGAAAT G CT T T C CAAAAC C GCAAG GGT AG 




Qy 


1920 


ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 


1979 




• lltfetlllAllilltlllllllllltlllltllltllllllllllllllllllllllll 

II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 




Db 


1510 


ACT G GTT T AT C CACC CACAACAT CT AC GAAT C GT ACT T CT TT AAT T GAT CT7\AT T T AC AT 




Qy 


1980 


ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 


2039 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 




Db 


1570 


ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 


1629 


Qy 


2040 


TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCT^GTACATG 


2099 




1 1 1 1 1 1 1 1 1 II M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1630 


T Ai^AT GAAACCAGAAGGATATTTACT ACTTTT GCAT GAAAAT AGAGCTTT CAAGT ACAT G 


168 9 


Qy 


2100 


GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 


2159 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


1690 


GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 


1749 


Qy 


2160 


GAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCTyVACA 


2218 




II 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 n 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


1750 


GAGATTAACGACTVAGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACA 


1809 


Qy 


2219 


CAATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 2268 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 




Db 


1810 


CAATATGGGCTCAAGTCACTTTTATTTGA7\ATGTCATTTGGTGCCAGTAT 1859 





RESULT 15 


ABZ96597 


ID 


ABZ96597 standard; DNA; 1868 BP. 


XX 




AC 


ABZ96597; 


XX 




DT 


17-OGT-2003 (first entry) 


XX 




DE 


Human endothelin receptor A nucleic acid. 


XX 




KW 


Human; antisense; lung dysfunction; nasal airway dysfunction; 


KW 


antiinflammatory steroid; ubiquinone; antiinflammatory; antiallergic; 


KW 


antiasthmatic; hypotensive; immunosuppressive; cytostatic; gene therapy; 


KW 


antisense gene therapy; respiratory; lung; adenosine sensitivity; 


KW 


adenosine receptor; bronchodilation; bronchoconstriction; lung allergy; 


KW 


lung inflammation; respiratory disease; ds . 


XX 




OS 


Homo sapiens. 


XX 




PN 


WO200285308-A2. 


XX 




PD 


31-OCT-2002. 


XX 




PF 


23-APR-2002; 2002WO-US013135 . 


XX 




PR 


24-APR-2001; 2001US-0286137P . 



XX 

PA (EPIG-) EPIGENESIS PHARM INC. 
XX 

PI Nyce JW, Li Y, Sandrasagra A, Katz E, Pabalan J, Aguilar D; 

PI Miller S, Tang L, Shahabuddin S; 

XX 

DR WPI; 2003-229219/22. 
XX 

PT Pharmaceutical composition for treating ailments associated with impaired 

PT respiration, has oligo{s) antisense to specific gene(s) or its 

PT corresponding RNAs, and glucocorticoid or non-glucocorticoid steroid or 

PT ubiquinone. 

XX 

PS Disclosure; SEQ ID NO 11839; 872pp; English. 
XX 

CC The invention relates to a novel pharmaceutical composition, which has a 

CC first active agent comprising an oligonucleotide antisense to the 

CC initiation codon, coding region, 5* or 3 ' end genomic flanking regions, 

CC 5' and 3' intron-exon junctions, or regions within 2-10 nucleotides of 

CC junctions of genes encoding a polypeptide associated with lung and/or 

CC nasal airway dysfunction and a second active agent comprising an 

CC antiinflammatory steroid and ubiquinone. A composition of the invention 

CC has antiinflammatory, antiallergic, antiasthmatic, hypotensive, 

CC immunosuppressive, and cytostatic activity. The composition may have a 

CC use in antisense gene therapy. The composition is useful for treating or 

CC preventing a respiratory, lung or malignant disease or condition, also 

CC for enhancing the prophylactic or therapeutic respiratory effect of an 

CC antiinflammatory steroid in a subject, for reducing or depleting levels 

CC of, or reducing sensitivity to adenosine, reducing levels of adenosine 

CC receptor, producing bronchodilation, increasing levels of ubiquinone or 

CC lung surfactant in a subject's tissue, or treating bronchoconstriction, 

CC lung inflammation, lung allergies, or a respiratory disease or condition. 

CC Note: The sequence data for this patent is not represented in the printed 

CC specification, but was obtained in electronic format directly from WIPO 

CC at ftp.wipo.int/pub/published_pct_sequences 
XX 

SQ Sequence 1868 BP; 512 A; 419 C; 389 G; 548 T; 0 U; 0 Other; 

Query Match 44,3%; Score 1819.6; DB 7; Length 1868; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 1844; Conservative 0; Mismatches 4; Indels 2; Gaps 2; 

Qy 421 AAAAAGTGAAGGTGTAATVAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 10 AAA7\AGTGAAGGTGTAAAAGCAGCACAAGTGC7iJVTAAGAGATATTTCCTCAAATTTGCCT 69 

Qy 481 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTT^T 54 0 



Db 



70 




129 



Qy 



541 



CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 



600 



Db 



130 




189 



Qy 



601 



TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 



660 



Db 



190 




249 



Qy 661 ACCCAGC7\ATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

I I I I I I I I I II I I I M M I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 250 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 309 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGG7\ATGGTGGGGAATGC 78 0 

I II I II I I I I I I II ! I I I I I I I I I II I I II I I II I II II II I M I II II II II I I II I II 

Db 310 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 369 

Qy 781 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGG7VATGGCCCCAACGCGCTGAT 84 0 

I I I I II I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I M 

Db 370 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 42 9 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 430 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 489 

Qy 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGC7VA 960 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 4 90 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 54 9 

Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 550 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 609 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 610 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 669 

Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 67 0 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 72 9 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGTU^TATAGGGGTGAACAGCATAAAACCTG 12 00 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 730 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 789 

Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I 

Db 7 90 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGT7yU^.GGACTGGTGGCT 84 9 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I M I I I I I I I I I I M I I M I M I I I I II I I I I I I M I I II I M I I I I I I I I I I I I 

Db 850 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 909 

Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 910 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 969 

Qy 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 4 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 970 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1029 

Qy 1441 GTTCCCTCTTCACTT7\AGCCGTATATTG7\AGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I II I I I I I I I I I I I I I I I 

Db 1030 GTTCCCTCTTCATTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAGATGGACAAGAA 108 9 



Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 1090 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1149 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 1150 CATGAATTCATGTATA/yVCCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1209 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1210 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1269 

Qy 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCAC7VACACAGACCG 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M 

Db 127 0 CATGTyVCGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 132 9 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1330 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 13 8 9 

Qy 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGT^TCTCTTCTCTGATC 18 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1390 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGAGTCCGGGAATCTCTTCTCTGATC 1449 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAA-GGTAG 1919 

I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 1450 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGGTAG 1509 

Qy 192 0 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 197 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M 
Db 1510 ACTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACAT 15 69 

Qy 198 0 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 2039 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I 

Db 157 0 ATTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGT 162 9 

Qy 204 0 TAAATGAAACCAG7\AGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 2099 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1630 TAAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATG 1689 

Qy 2100 GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 2159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1690 GCTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTA 17 49 

Qy 2160 GAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGA-TTTTTTGTCCTTCAGCCAAACA 2218 

I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I 

Db 1750 GAGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTTGTCCTTCAGCCAAACA 18 09 

Qy 2219 CAATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 2268 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1810 CAATATGGGCTCAAGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTAT 1859 



Search completed: May 14, 2004, 01:24:47 
Job time : 1448.24 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 

Run on: May 14, 2004, 00:25:48 ; Search time 254.426 Seconds 

(without alignments) 
8953.776 Million cell updates/sec 

Title: US-09~931-157-1 
Perfect score: 4105 

Sequence: 1 gaattcgcggccgcctcttg taaaagtttacagaaacctt 4105 



Scoring table: 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



1365418 



Searched: 682709 seqs, 277475446 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : Issued_Patents__NA: * 

1: /cgn2_6/ptodata/2/ina/5A_COMB. seq:* 

2 : /cgn2_6/ptodata/2/ina/5B_COMB. seq:* 

3 : /cgn2_6/ptodata/ 2 /ina/ 6A_C0MB . seq : * 

4 : /cgn2_6/ptodata/2/ina/6B_COMB. seq: * 

5: /cgn2_6/ptodata/2/ina/PCTUS_COMB.seq: * 

6 : / cgn2_6/ ptodata/ 2/ ina/backf ilesl . seq : * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 



Result 
No. 


Score 


Query 
Match 


Length 


DB 


ID 


Description 


1 


4105 


100.0 


4105 


4 


US-08-121-446-1 


Sequence 


1, Appli 


2 


4079 


99. 4 


4079 


4 


US-09-016-434-1257 


Sequence 


1257, Ap 


3 


406.2 


9.9 


1321 


4 


US-09-175-658B-20 


Sequence 


20, Appl 


4 


395. 8 


9.6 


1470 


4 


US-09-016-434-1203 


Sequence 


1203, Ap 


5 


395.8 


9.6 


1873 


3 


US-08-910-864-13 


Sequence 


13, Appl 


6 


395.8 


9.6 


4301 


4 


US-08-121-446-3 


Sequence 


3, Appli 


7 


101.8 


2.5 


1700 


5 


PCT-US92-02091-1 


Sequence 


1, Appli 


8 


91 


2.2 


1726 


4 


US-09-016-434-1215 


Sequence 


1215, Ap 


9 


91 


2.2 


1726 


5 


PCT-US92-02091-3 


Sequence 


3, Appli 


10 


79. 6 


1.9 


1205 


3 


US-09-120-772-1 


Sequence 


1, Appli 


11 


79.6 


1.9 


1413 


4 


US-09-016-434-1275 


Sequence 


1275, Ap 





12 


68 


. 6 


1 . 


7 


1352 


4 


US- 09- 01 6- 4 34 -12 33 


Sequence 


1233, Ap 




13 


68 


. 6 


1. 


7 


1352 


5 


PCT-US92-02091-7 


Sequence 


7f Appli 




14 


65 


. 8 


1 . 


6 


1584 


5 


PCT-US92-02091-5 


Sequence 


5, Appli 




15 


63 


. 6 


1. 


5 


1563 


1 


US-08-27 9-590A-1 


Sequence 


1, Appli 




16 


63 


. 6 


1. 


5 


1563 


1 


US-08-910-092-1 


Sequence 


1, Appli 




17 


55 


. 6 


1. 


4 


11015 


4 


US- 10-2 04-7 08-55 


Sequence 


55, Appl 


c 


18 


51 


. 4 


1. 


3 


3095 


6 


5231168-1 


Patent No 


5231168 




19 


50 


.2 


1. 


2 


832 


4 


US-09-62 1-976-28 13 


Sequence 


2813, Ap 




20 


49 


. 6 


1. 


2 


505 


4 


US- 09- 62 1-976-15639 


Sequence 


15639, A 




21 


48 


. 8 


1. 


2 


5152 


4 


US- 10-2 04-7 08-7 3 


Sequence 


73, Appl 




22 


48 


. 6 


1. 


2 


6656 


4 


US- 10-2 04 -7 08 -7 5 


Sequence 


75, Appl 


c 


23 


48 


. 4 


1. 


2 


11049 


4 


US- 10-204-708-22 


Sequence 


22, Appl 


c 


24 


47 


. 8 


1. 


2 


832 


4 


US- 09- 62 1-97 6-2 8 13 


Sequence 


2 813, Ap 




25 


47 


.4 


1. 


2 


1842 


4 


US-09-17 0-496D-91 


Sequence 


91, Appl 




26 


47 


.4 


1. 


2 


1842 


4 


US-09-17 0-4 96D-211 


Sequence 


211, App 




27 


46 


. 8 


1. 


1 


1238 


4 


US-09-761-962A-2 


Sequence 


2, Appli 




28 


46 


. 8 


1. 


1 


1257 


4 


US-09-761-962A-5 


Sequence 


5, Appli 




29 


46 


. 8 


1. 


1 


1334 


4 


US- 09-7 61-9 62A-3 


Sequence 


3, Appli 




30 


46 


. 8 


1. 


1 


1346 


4 


US-09-761-962A-12 


Sequence 


12, Appl 




31 


46 


. 8 


1. 


1 


1365 


4 


US-09-761-962A-11 


Sequence 


11, Appl 




32 


46 


. 8 


1. 


1 


1423 


4 


US-09-761-962A-1 


Sequence 


1, Appli 




33 


46 


. 8 


1. 


1 


1542 


4 


US- 09-7 61-9 62A-4 


Sequence 


4, Appli 




34 


46 


. 8 


1. 


1 


1610 


4 


US-09-761-962A-16 


Sequence 


16, Appl 




35 


46 


, 8 


1. 


1 


1729 


4 


US-09-761-962A-9 


Sequence 


9, Appli 




36 


46 


.8 


1. 


1 


1981 


3 


US-08-387-707-15 


Sequence 


15, Appl 




37 


46 


.8 


1. 


1 


1981 


4 


US-08-405-271A-15 


Sequence 


15, Appl 




38 


46 


. 8 


1. 


1 


2045 


4 


US-09-761-962A-10 


Sequence 


10, Appl 




39 


46 


.8 


1. 


1 


2229 


4 


US-09-214-904-1 


Sequence 


1, Appli 


c 


40 


46 


.4 


1. 


1 


6583 


4 


US- 10-2 04 -7 08-2 6 


Sequence 


2 6, Appl 




41 


46 


.2 


1. 


1 


595 


1 


US-08-784-289-1 


Sequence 


1, Appli 




42 


46 


1. 


1 


1164 


4 


US-09-601-198-65 


Sequence 


65, Appl 


c 


43 


46 


1. 


1 


2563 


2 


US-08-553-436A-7 


Sequence 


7, Appli 


c 


44 


45 


. 8 


1. 


1 


19124 


2 


US-08-487-826B-13 


Sequence 


13, Appl 


c 


45 


45 


.6 


1. 


1 


640681 


4 


US-09-790-988-1 


Sequence 


1, Appli 



ALIGNMENTS 



RESULT 1 
US-08-121-446-1 

; Sequence 1, Application US/08121446 

; Patent No. 6313276 

; GENERAL INFORMATION: 

; APPLICANT: IMURA, HIROO 

; APPLIC7\NT: NAKAO, KAZUWA 

APPLICANT: NAKANISHI, SHIGETADA 

TITLE OF INVENTION: A HUMAN ENDOTHELIN RECEPTOR 
NUMBER OF SEQUENCES: 4 
CORRESPONDENCE ADDRESS: 

7VDDRESSEE: MORRISON & FOERSTER 

STREET: 755 Page Mill Road 

CITY: Palo Alto 
; STATE: California 

COUNTRY: USA 

ZIP: 94304-1018 
; COMPUTER READABLE FORM: 



MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentin Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/121, 44 6 
FILING DATE: 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/911,684 
FILING DATE: lO-JUL-1992 
ATTORNEY/AGENT INFORMATION: 
NAME: CIOTTI, THOMAS E. 
REGISTRATION NUMBER: 21,013 
REFERENCE/ DOCKET NUMBER: 29900-20324.00 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 813-5600 
TELEFAX: (415) 494-0792 
TELEX: 706141 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 4105 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
FEATURE : 

NT^ME/KEY: CDS 
LOCATION: 48 5. . 17 68 
FEATURE : 

NAME/ KEY: mat_peptide 
LOCATION: 545 
US-08-121-446-1 

Query Match 100.0%; Score 4105; DB 4; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I M M I I I I I I I I i I I I I I I I I I I I 

Db 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

Qy 61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I M I I 

Db 61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

Qy 121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 121 CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

Qy 181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M M I I I I I M I I I I I 

Db 181 CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 240 

Qy 241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I I I I M I I I M I I I I I I I I I I I I I M I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I 
Db 241 GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 



Qy 3 01 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

I I M I 11 I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I M I 

Db 301 CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

Qy 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTG7\AAA 42 0 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 420 

Qy 421 AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AAAAAGTGAAGGTGTAAAAGCAGCAC7\AGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

Qy 4 81 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

Qy 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

Qy 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCT^ACCCACTAATTTGGTCCT 660 

Qy 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I M M I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 661 ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 72 0 

Qy 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

Qy 7 81 AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 81 AACTCTGCTCAGGATCATTTACCAGTyVCAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

Qy 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 841 AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

Qy 9 01 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I 

Db 901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

Qy 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I I I I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

Qy 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

Qy 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGT^ATATAGGGGTGAACAGCATAAAACCTG 12 00 



Db 



I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 12 00 



Qy 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I 

Db 12 61 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 132 0 

Qy 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 138 0 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 138 0 

Qy 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 144 0 

Qy 14 41 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAA7\ACTGTGTATAACGAAATGGACAAGAA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I M I I I I I 

Db 14 41 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 150 0 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 162 0 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I 

Db 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 162 0 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M i I I I I I I I I I I I I I I I 

Db 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 168 0 

Qy 1681 CATGAACGG7\ACAAGCATCCAGTGGAAGAACCACGATCA7W^CAACCACAACACAGACCG 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I 

Db 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 17 4 0 

Qy 17 41 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGT^AGCACTCCTCGGTACTCCCAT 18 0 0 

I I I I I i I I I I I I I I I I I I I I I I II I I M I M I I I I I I I M I I I M I I I i I I I i I I I I I I I 

Db 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

Qy 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 

I I I I I I I I I II I I I I I I I I II I I I I I I II II I I I I I I I I I I II I I I I I I II II I I I I I I I 
Db 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCTUVAACCGCAAGGTAGA 192 0 

I I I II I II II I I I I I I I I I I I I I II I II I I I I II II I I I I I I II I I I I I I I I I I II I I I I 

Db 1861 CTTCTTCCTTT^TTCACTCCCACACCCAAGAAGTWVTGCTTTCCAAAACCGCAAGGTAGA 1920 

Qy 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

I I II I I II II I I I I II I M I I I II I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I 
Db 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 198 0 

Qy 1981 TTCTGCGTGTTGTATTCAGCACTAAATVAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 204 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I II I I I 



Db 1981 TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 204 0 

Qy 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 T^AATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

Qy 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

Qy 2161 AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 222 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 222 0 

Qy 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 2280 

I I I I I I I I M M I I I I I I I I I I I I I I I I I I I M I I i I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 2280 

Qy 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 234 0 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAA7\AAAAGACAAA 2340 

Qy 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTT7WV 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

Qy 2401 ACACAAATTCTAAAGCTACAACTWVTACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 2401 ACACA7UVTTCT7WVGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

Qy 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

Qy 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 2 521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 25 8 0 

Qy 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

Qy 2 641 7UWVTCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 2 641 A7\AATCAATGTCAAGTACCA7WVTGTTAATGTATGTGTCATTT7^CTCTGCCTGAGACTT 27 00 

Qy 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGA7VAAAGATCGAATTTTTCAG 27 60 

I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 27 01 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

Qy 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 61 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

Qy 2821 CACCTCCTATTCTCTTAATTTTTGTT7\AAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I 
Db 2821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2880 



Qy 2881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 28 81 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

Qy 2941 GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M M I I I I I I I M I I I I I I I I M 
Db 2941 GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAT^AG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

Qy 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 

Qy 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

Qy 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3301 GTCTGAGCTAi^AATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTTVACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 342 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGT7\ATCATGTTACCATTACAAATGGGATATA 3420 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

Qy 34 81 TGGTTTGATATyVGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

Qy 3541 CACTTTGT^GTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAA/yVTAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 



Qy 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I I I I I I I I I I I I I I I I I I I M M I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

Qy 3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I 
Db 3781 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

Qy 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATG7\AAAAAATGCATTTTATAA 3900 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCT^CGTGCATTTTATTTATGGACTGGTAAG 3960 

Qy 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I M I I I I I 
Db 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTC^ACA 4 02 0 

Qy 4 021 AGT7\ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 408 0 

M I II I II II I M M II II II II II II II I I I II I II II II II I II I I I II II 1! II II I 

Db 4021 AGTT^ACTTTGTAG^AATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 408 0 

Qy 4081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I I M II II I I I M I I I II I I I I I I I 
Db 4 081 TAAAATAAAAGTTTACAGAAACCTT 4105 
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Qy 5 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 60 

Qy 65 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 124 

I I I I I I I I I I I I I i i I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 12 0 

Qy 125 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 184 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 

Db 121 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 18 0 

Qy 185 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGT^GCAG 24 4 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 181 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAG 24 0 

Qy 245 TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 304 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 241 TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 300 

Qy 305 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 364 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 360 

Qy 365 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAA 424 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 361 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAA 420 

Qy 425 AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCT^AATTTGCCTCAAG 4 84 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I M I M I I I I M I I I I I I I M I I I I 
Db 421 AGTGAAGGTGTAAAAGCAGCACT^GTGCAATTUVGAGATATTTCCTCAAATTTGCCTCAAG 480 



Qy 



4 85 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 54 4 



I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 4 81 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 540 



Qy 


545 


GATT^T C CT GAGAGAT AC AG C ACAAAT CT AAGCAAT CAT GT GGAT GAT TT CAC C ACT T T T 


DU 






1 t 1 1 ■ 1 1 1 1 1 1 I 1 1 1 1 r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 




Db 


541 


GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 


600 


Qy 


605 


CGT GG CACAGAGCT CAGCT T C CT G GTTAC C ACT C AT CAAC C C ACTAAT T T G GT C CT AC C C 








1 1 1 1 1 ■ 1 1 ■ 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 r 1 1 1 1 1 1 1 I 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 




Db 


601 


CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 


660 


Qy 


665 


AG CAAT GG CT CAAT GCACAACT AT T GC C CACAGCAGACT AAAAT TACT T CAGCT T T CAAA 






111 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 




Db 


661 


AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 


720 


Qy 


725 


TACATTAACACT GT GAT AT CTT GTACTATTTT CAT CGT GGGAAT GGTGGGGAATGCAACT 


T O /I 

/d4 




1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


721 


TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCT^CT 


780 


Qy 


785 


CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 


84 4 




t t t , , t ti»lll1llllll4lllllllllllllllllllllllllllllll1lt 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


781 


CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 


840 


Qy 


845 


AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 


904 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 i 1 1 1 1 M 1 i 1 1 1 1 1 1 1 1 1 




Db 


841 


AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 


900 


Qy 


905 


CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 


960 


Ov 


965 


TTCCCCTTTTTGCAGTyVGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 


1024 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


961 


TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 


1020 


Qy 


1025 


GT T GACAGGT AC AGAGCAGT TGCCTCCT GGAGT C GT GT T C AGGG7\ATT GG GAT T C CTT T G 


T n o yi 
lUo 4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1021 


GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 


1080 


Qy 


1085 


GTAACT GC CATT GAAAT T GT CT C CAT CT G GATCCT GT C CT TT AT C CT GGC CAT T C CT GAA 
1 1 1 1 1 1 1 1 1 1 1 1 > 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ) 1 1 1 1 1 1 1 1 1 1 1 




Db 


1081 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 i 1 M 

GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 


1140 


Qy 


1145 


G CGAT TGGCTTCGT CAT GGT ACC CT T T GAAT ATAGGGGT GAAC AGC AT AAAAC CT GTAT G 






1,11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i p 1 1 1 1 t 1 1 1 1 t 1 1 1 1 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M M M 1 1 M 1 1 M M 1 1 M 1 




Db 


1141 


GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 


1200 


Qy 


1205 


CT C7\AT GC CACAT CAAAAT T CAT GGAGT i C i AL LAAGA i G i AAAGbAO iCjbitjbUlL-i 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 t 1 [ 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 
1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 M 1 1 1 1 M 1 1 1 i 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 i M 1 1 M 1 ^ 




Db 


1201 


CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 


1260 


Qy 


1265 


GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 


1324 




M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 


1320 


Qy 


1325 


GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 


1384 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 





Db 


1321 


GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 


1380 


Qy 


1385 


CGTCGAGAAGTGGCAAAAACAGT 1 i i L-HaL-l 1 i CjJ. AAi i i i i ijUi ui i i ij^^hj*^ i x 


1444 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 i 1 1 




Db 


1381 


CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 


1440 


Qy 


1445 


C CT CT T C ACT T AAGC C GT AT AT T GAAGAAAAC i b i (j 1 A 1 OAAAi ^ 


1504 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


1441 


CCTCTTCACTTAAGCCGTATATTGAA.GAAAACTGTGTATAACGAAATGGACAAGAACCGA 


1500 


Qy 


1505 


TGTGAATTACTTAGTTTCTTACTGCTCAl GGAi 1 ALAi LOCjI Ai iAAL-i i (jtjUAAU^^AHa 


X -wJ U *4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 M 1 1 1 1 1 




Db 


1501 


TGTGAATT ACTTAGTTT CTT ACT GCT CAT GGATTAC AT CGGTATTAACTT GGCAAC CAT G 


1560 


Qy 


1565 


AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAAi i iAAA/\Pi.L ICji i iU 


X 0^ ft 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1561 


AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTC 


1620 


Qy 


1625 


CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGAi GACCi uC^CjI OUUUAi 


X D 0 *i 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II i 1 1 




Db 


1621 


CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 


1680 


Qy 


1685 


AACGGAACAAGCAT CCAGTGG7\AGAACCACGAT CAAAACAALCAt^AAuAUAbAUC.tjijAijL. 


X / fi 1 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1681 


AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 


1740 


Qy 


1745 


_ __ _ _ , _ -p. _-_ ^ „ A -A TV TV "jv /^mm TV TV TV TV /~*fTt f* rp rp TV rp /"* /~* /~* TV rp TV TV rp 

AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCC i LGGi AU i CUUAi AAi u 


X 0 U rl 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1741 


AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATC 


1800 


Qy 


1805 


CTCTCGGAGAAAATWVTCACAAGGCAACTGTGACTCCGGGAATCTCi iOiUiCjAiUUl 


1 ft f^zi 




M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 M 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1801 


CTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTTC 


1860 


Qy 


1865 


TT C CT T AAT TCACT C C CAC AC C CAAGAAGAAAT GCT T T C CAAAAC C_ CirCAACjtcr 1 PJ^Jv^ Hj(j 


1 Q 9 4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1861 


TTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTGG 


1920 


Qy 


1925 


i-nn-im -« i-i-i ir~™-- y-xy^y^-n »-^-fv TV y-<Tv m /"< m TV / — * TV TV rP /"TP TV rp rp /~« rprp rp TV 7\ rp rp TV rn rp Tv 71 rp rp rp TV f~" TV T' 7\ T^T'/^T' 

TTTATCCACCCACAACATCTACGAATCGTACTTCl i iAAJ. ibAluiAAi i lAUAlAi iv^i 


_L 0 rl 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 M 1 M 




Db 


1921 


TTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCT 


1980 


Qy 


1985 


GCGTGTTGTATTCAGCACTAAAAAAi GGi bbGAGL-HjCjULiLjAtjAAi vjAALjAUI icri 


?04 4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


1981 


GCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAAT 


2040 


Qy 


2045 


y-, T. _ Tv<^/-<Tv^Tv T\ -fy rpTv rprprpTv /-<rpTV i^rprprprp/^r^Arp/^A A A ATA/^A /^r~'T"T"T'f^A (^T* T^l C Zi T'/^^^r^T' ZVf^ 

GAAACCAG7y\.GGATATTTACTACTT i i GCAi CjAAAAI ACjAuU i i i UAAbi AUAi 


91 04 

^ X w 1 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i i 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2041 


GAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 


2100 


Qy 


2105 


_____ _ m/-«/-<»--<Tv /^rnrpj^rp/^/^rp/^ TV TV rp /-< rp rp tv tv rp tv Tv/^rp/^/^rpf^TV/^/^AT^B Zi Z\r^'P'T"T'ZiPZir^Z\'T' 

CTTTTATGGCAGTTCTGGTGAAi Gi i CAAi GGGAAC i UA(^UA1 bAAAO J. i i A(j>\LiA1 


91 f^4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 [ 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 M 1 1 M 1 M 1 1 1 1 M 1 1 M 1 M M i 1 1 1 1 1 1 1 1 1 It 1 1 1 




Db 


2101 


CTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGAT 


2160 


Qy 


2165 


TAACGACAAGATTTTCTACTTTTTTT7VAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 


2224 




1 1 1 1 1 M M 1 1 1 1 1 1 1 M 1 1 M 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2161 


TAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 


2220 



Qy 2225 GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 228 4 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 2221 GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 22 8 0 

Qy 2285 AGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAATA 2344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 2281 AGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAT^AATA 2340 

Qy 2345 GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACAC 2404 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M 

Db 2341 GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACAC 24 00 

Qy 2405 AAATTCTAAAGCTACAACAAATACTACAGGCCCTTTVAAGCACAGTCTGATGACACATTTG 2464 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 2401 AAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTTG 24 60 

Qy 2465 GCAGTTT7\ATAGATGTTACTCAAAGAATTTTTT7^GAACTGTATTTTATTTTTTAAATGG 2524 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2461 GCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTT7WVTGG 2520 

Qy 2525 TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCA 2584 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCA 258 0 

Qy 2585 ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTA7\ATTTTGTATGAAAAA 2644 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAAA 2 64 0 

Qy 2 645 TCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 2704 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 2 641 TCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTT7VACTCTGCCTGAGACTTTCAG 27 00 

Qy 2705 TGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATGA 2764 

I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 2701 TGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATGA 2760 

Qy 2765 TTCGGAAATTTTCATTCAGGTATTTGTT^TAGTGACATATATATGTATATACATATCACC 2824 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 2761 TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 2820 

Qy 2 825 TCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTCC 288 4 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 2821 TCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTT^GTCTTTTTTGATCATTCC 2880 

Qy 2 885 CTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTG7WV 2 94 4 

I I I I I I I I I I I I M I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 881 CTTTTCCATATAGGAi\ACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAAA 294 0 

Qy 2945 AATAATTACCCACAAATGCCACCAGTT^CTTAACGATTCTTCACTTCTTGGGGTTTTCAG 3004 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 941 AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAG 3000 

Qy 3005 TATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 3064 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 TATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 3060 



Qy 3065 CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAAA 3124 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 3061 CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAAA 3120 

Qy 3125 TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 3184 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 3180 

Qy 3185 TTCTAGACTGTCTCTGTGGTVATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 32 44 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 32 4 0 

Qy 3245 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3304 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 3241 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 33 00 

Qy 3305 GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTi^ACCTGTA 3364 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 3360 

Qy 3365 GCAACCTTCTGCATTCATAAATCTTGT7VATCATGTTACCATTACAAATGGGATATAAGAG 3424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I 

Db 3361 GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 3420 

Qy 3425 GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 84 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3421 GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 80 

Qy 3485 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 3544 

I I I I I I I M I I I I I I I [ I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 3481 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 354 0 

Qy 3545 TTGT^GTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3604 

I I I I I I I I I I. M I I I I I I I I I I I I I M M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 TTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3600 

Qy 3605 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATTyVTTT 3664 

I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 3601 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATTT 3660 

Qy 3665 GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAG 3724 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 3661 GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGT^TTGCAAG 3720 

Qy 3725 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 37 84 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3721 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 3780 

Qy 37 8 5 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 38 44 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 37 81 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 384 0 

Qy 3845 TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTC 3904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTC 3900 

Qy 3905 AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 3964 







1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 


Db 


3901 


AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 3960 


Qy 


3965 


TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAtrl A 41 41 




1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M M M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 


Db 


3961 


TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 4020 


Qy 


4025 


ACTTTGTAG7WVTGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 4 083 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 


Db 


4021 


ACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 4 07 9 



RESULT 3 

US-09-175-658B-20 

; Sequence 20, Application US/09175658B 

; Patent No. 6372900 

; GENERAL INFORMATION: 

; APPLICANT: METALLINOS, DANIKA 

; APPLICANT: RINE, JASPER 

; APPLICANT: BOWLING, ANN 

; TITLE OF INVENTION: HORSE ENDOTHELIN-B RECEPTOR GENE AND GENE PRODUCTS 
; FILE REFERENCE: GOBR-110 

; CURRENT APPLICATION NUMBER: US/ 09/ 17 5 , 658B 

; CURRENT FILING DATE: 1998-10-20 

; PRIOR APPLICATION NUMBER: 60/062,562 

; PRIOR FILING DATE: 1997-10-21 

; NUMBER OF SEQ ID NOS : 25 

; SOFTWARE: PatentlnVer. 2.1 

; SEQ ID NO 20 

LENGTH: 1321 

TYPE: DNA 
; 0RG7\NISM: Horse 
US-09-175-658B-20 

Query Match 9.9%; Score 406.2; DB 4; Length 1321; 

Best Local Similarity 67.2%; Pred. No. 1.2e-96; 

Matches 630; Conservative 0; Mismatches 283; Indels 24; Gaps 3; 

Qy 717 CTTTCAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGA 77 6 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 310 CTTTCAAGTACATCAACACAGTAGTGTCCTGCCTAGTGTTCGTGCTGGGCATCATCGGAA 369 

Qy 777 ATGCAACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGC 836 

I I II II I I I II I II I I I I II I I II II I II III MM I II II II 

Db 370 ACTCCACACTGCTGAGAATCATTTACAAGT^ACAAGTGCATGCGGAACGGCCCTAATATCT 42 9 

Qy 837 TGATAGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATG 8 96 

II II II I II I I II II II I II II I I I II II I II I I II M I II M 

Db 430 TGATCGCCAGCCTGGCTCTCCGAGACCTGCTGCAAATCATCATTGACGTCCCCATCAATG 489 

Qy 897 TATTTAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTT 956 

II II II II I II II II I II II II I II II I I I II 

Db 4 90 TCTACAAGCTGCTGGCTGAGGACTGGCC CTTTGGAGTCGAGATGT 534 

Qy 957 GCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCJ^ACCTCTGCG 1016 

I II II I I I I I II I II II II II I I II II I II I M II II I II II I 
Db 535 GTAAGCTGGTGCCTTTCATACAGAAGGCCTCCGTGGGCATCACTGTGCTGAGTCTGTGTG 594 



Qy 1017 CTCTTAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGA 107 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 595 CTCTAAGTATTGACAGATATCGAGCTGTTGCTTCCTTGGAGCGAATTAAAGGAATTCGGG 654 

Qy 1077 TTCCTTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCA 1136 

I I I I I I I I I I I I I I I M I I I I I I I III I I I I I I I 

Db 655 TTCCAAAATGGACAGCAGTAGAAATTGTTTTAATTTGGGTGGTCTCTGTGGTTCTGGCTG 714 

Qy 1137 TTCCTGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAA 1196 

I I I II I I I I I I I I I I INI II I I I I I I II II II 

Db 715 TCCCTGAAGCCGTGGGTTTTGATATGATTACCGCTGACTACAAAGGAAGTTATCTGCGAA 774 

Qy 1197 CCTGTATGCTCAATGCCAC ATCAAAATTCATGGAGTTCTACCAAGATGTAAAGG 1250 

III I I I I II I I II III I I I I II I I I I I I I I III II I I 

Db 775 TCTGCCTGCTTCATCCCACTCAGAAAACAGCCTTCATGCAGTTTTACAAGAATGCTAAGG 834 

Qy 1251 ACTGGTGGCTCTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACA 1310 

I I I II I I I I I I I I I I I I I I I I I I I II II I I II MINI I I I I I I 

Db 835 ACTGGTGGCTATTTAGTTTCTATTTCTGCTTGCCATTGGCCATCACTGCATTTTTTTATA 894 

Qy 1311 CCCTCATGACTTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTG 1370 

II I I I I I I I I I I Ill I I II Ill 

Db 8 95 CCTTGATGACCTGTGAAATGTTGAG7WVGAAGAGTGGCA TGCAAATTGCTTTAAATG 951 

Qy 1371 AACATCTTAAGCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTG 1430 

IN I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 1 I I I I I 

Db 952 ATCACTTAT^GCAGAGAAGGGAAGTGGCGAAT^CAGTATTCTGCCTGGTCCTTGTCTTTG 1011 

Qy 1431 CTCTTTGCTGGTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAA 14 90 

I II I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

Db 1012 CCCTGTGCTGGCTTCCTCTTCACCTCAGCAGGATTTTGAAACACACTCTTTATGATCAGA 1071 

Qy 14 91 TGGACAAGAACCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTA 1550 

II I I I I I I I I I I I II I I I I III I It I I I I M I I I I I 

Db 1072 ATGATCCCCATAGATGTG7\ACTTTTGAGCTTTTTGTTGGTATTGGACTACATTGGCATCA 1131 

Qy 1551 ACTTGGCAACCATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAAT 1610 

II I I I I M I I I I I I I II II II II I I II I I M I I I I I I I I I I I I I I I II 

Db 1132 ACATGGCCTCCCTGAATTCCTGCATTAATCCAATAGCTCTGTATTTGGTGAGCAAAAGAT 1191 

Qy 1611 TTAAAAATTGTTTCCAGTCATGCCTCTGCTGCTGCTG 1647 

I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 1192 TCAAT^CTGCTTTAAGTCGTGCTTATGCTGCTGGTG 122 8 



RESULT 4 

US-09-016-434-1203 

; Sequence 1203, Application US/09016434 
; Patent No. 6500938 

GENERTM. INFORMATION: 
; APPLICANT: Janice Au-Young 

APPLICANT: Jeffrey J. Seilhamer 

TITLE OF INVENTION: COMPOSITION FOR THE DETECTION OF SIGNALING 
TITLE OF INVENTION: PATHWAY GENE EXPRESSION 
NUMBER OF SEQUENCES: 1490 
CORRESPONDENCE ADDRESS: 



ADDRESSEE: INCYTE PHARMACEUTICALS, IMC. 
STREET: 3174 PORTER DRIVE 
CITY: PALO ALTO 
STATE: CALIFORNIA 
COUNTRY: USA 
ZIP: 94304 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Word Perfect 6,1 for Windows /MS-DOS 6,2 
; CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 09/ 016, 4 34 
; FILING DATE: HEREWITH 

CLASSIFICATION: 
; PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 
; FILING DATE: 

CLASSIFICATION: 
ATTORNEY/AGENT INFORMATION: 

NAME: Zeller, Karen J. 

REGISTRATION NUMBER: 37,071 

REFERENCE/ DOCKET NUMBER: PA-0002 US 
TELECOMMUNICATION INFORMATION: 

TELEPHONE: (650) 855-0555 

TELEFAX: (650) 845-4166 
; INFORMATION FOR SEQ ID NO: 1203: 
; SEQUENCE CHARACTERISTICS: 

; LENGTH: 1470 base pairs 

; TYPE: nucleic acid 

STRANDEDNESS: single 
; TOPOLOGY: linear 

IMMEDIATE SOURCE: 

LIBRARY: GENBANK 

CLONE: gl82275 
US-09-016-434-1203 

Query Match 9.6%; Score 395.8; DB 4; Length 1470; 

Best Local Similarity 65.7%; Pred. No. 6.7e-94; 

Matches 634; Conservative 0; Mismatches 307; Indels 24; Gaps 3 
Qy 689 TGCCCACAGCAGACTT^AAATTACTTCAGCTTTCAAATACATTAACACTGTGATATCTTGT 74 8 



Db 



314 




Qy 



749 



ACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAAC 808 



Db 



374 



CTTGTGTTCGTGCTGGGGATCATCGGGAACTCCACACTTCTGAGAATTATCTACAAGAAC 433 



Qy 



Db 



809 



434 



AAATGTATGAGGAATGGCCCC7U\CGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATC 8 68 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

AAGTGCATGCGAAACGGTCCCAATATCTTGATCGCCAGCTTGGCTCTGGGAGACCTGCTG 4 93 



Qy 



Db 



494 



869 




Qy 929 GATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCG 98 8 

MINI I M I I I I I I I I I I I I I I I I I MM 

Db 550 ATTTGGAGCTGAGATGTGTAAGCTGGTGCCTTTCATACAGAAAGCCTCC 598 

Qy 989 GTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCC 104 8 

I I M I M M I M M I M M M M I M I I M I M I M M M M M I 

Db 599 GTGGGAATCACTGTGCTGAGTCTATGTGCTCTGAGTATTGACAGATATCGAGCTGTTGCT 65 8 

Qy 1049 TCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGTiAATTGTCTCC 1108 

I I I I I I I I I M I M M M M I M M MM I M M M I I I 

Db 659 TCTTGGAGTAGAATTAAAGGAATTGGGGTTCCAAAATGGACAGCAGTAGAAATTGTTTTG 718 

Qy 1109 ATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCC 1168 

I I I I I I I M I I M M I I M M I M I M M M I M I I 

Db 719 ATTTGGGTGGTCTCTGTGGTTCTGGCTGTCCCTGAAGCCATAGGTTTTGATATAATTACG 77 8 

Qy 1169 TTTGAATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCC ACATCAAAA 1222 

I I I I I I II II Mill II II II II I M 

Db 779 ATGGACTACAAAGGAAGTTATCTGCGAATCTGCTTGCTTCATCCCGTTCAGAAGACAGCT 838 

Qy 1223 TTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATG 1282 

I I II I I I II I II I I I I II I I II I II II I II I I II II I II II II II 

Db 839 TTCATGCAGTTTTACAAGACAGC7U\AAGATTGGTGGCTGTTCAGTTTCTATTTCTGCTTG 898 

Qy 1283 CCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGG 1342 

II I II I II M I I I I I M I I II II I I I II II I II I II I I II I I 

Db 899 CCATTGGCCATCACTGCATTTTTTTATACACTAATGACCTGTGAAATGTTG AGAAAG 955 

Qy 1343 AATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCAAAA 1402 

II I II I I I II I I I I II I II II II I II I I II II II II II II I 

Db 956 AAAAGTGGCATGCAGATTGCTTTAAATGATCACCTT^AAGCAGAGACGGGAAGTGGCCAAA 1015 

Qy 1403 ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGT 1462 

I I I I I I II I I I I I I I M I II I I M II I I I II II I II I I II I I 

Db 1016 ACCGTCTTTTGCCTGGTCCTTGTCTTTGCCCTCTGCTGGCTTCCCCTTCACCTCAGCAGG 1075 

Qy 14 63 ATATTGAAGAA7\ACTGTGTATAACGAAATGGACAAGAACCGATGTGAATTACTTAGTTTC 1522 

II II II I II I I I II I I II II M I II II II I I I II II 

Db 1076 ATTCTGAAGCTCACTCTTTATAATCAGAATGATCCCAATAGATGTGAACTTTTGAGCTTT 1135 

Qy 1523 TTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTAT7\7^CCCC 1582 

I III I I II II II I II I I I I I II II I M II II I II II II M I 

Db 1136 CTGTTGGTATTGGACTATATTGGTATCAACATGGCTTCACTGAATTCCTGCATTAACCCA 1195 

Qy 1583 ATAGCTCTGTATTTTGTGAGCAAG7\AATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGC 1642 

II I I II I I II II I I II I II II I III II II I II II II II II II I II I II I 

Db 1196 ATTGCTCTGTATTTGGTGAGCAAAAGATTCAAAAACTGCTTTAAGTCATGCTTATGCTGC 1255 

Qy 1643 TGCTG 1647 

I I II 

Db 1256 TGGTG 1260 



RESULT 5 

US-08-910-864-13 

; Sequence 13, Application US/08910864 
; Patent No. 6280931 



GENERAL INFORMATION: 
; APPLICANT: SAKAMOTO, AIJI 
APPLICANT: HANAOKA, FUMIO 

TITLE OF INVENTION: METHOD FOR SPECIFICALLY AMPLIFYING A cDNA OF AN 
EXTREMELY 

TITLE OF INVENTION: SMALL QUANTITY 
NUMBER OF SEQUENCES: 13 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: FISH & RICHARDSON P.C. 
STREET: 4225 EXECUTIVE SQUARE, SUITE 1400 
CITY: LA JOLLA 
STATE : CA 
COUNTRY: USA 
ZIP: 92037 
; COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: PatentIn Release #1.0, Version #1.30 (EPO) 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 08/ 910 , 8 64 
FILING DATE: 13-AUG-1997 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: JP 216506/1996 
FILING DATE: 16-AUG-1996 
ATTORNEY/AGENT INFORMATION: 
NAME: HAILE, LISA A. 
REGISTRATION NUMBER: 38,347 
; REFERENCE/ DOCKET NUMBER: 07898/017001 

; TELECOMMUNICATION INFORMATION: 

TELEPHONE: 619-678-5070 
; TELEFAX: 619-678-5099 

; INFORMATION FOR SEQ ID NO: 13: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 1873 base pairs 

TYPE: nucleic acid 
STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA to luRNA 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 231.. 1556 
US-08-910-864-13 

Query Match 9.6%; Score 395.8; DB 3; Length 1873; 

Best Local Similarity 65.7%; Pred. No. 7.6e-94; 

Matches 634; Conservative 0; Mismatches 307; Indels 24; Gaps 3 

Qy 68 9 TGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAATACATTAACACTGTGATATCTTGT 748 

I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I 

Db 498 TGCCAAGGACCCATCGAGATCAAGGAGACTTTCA7\ATACATCAACACGGTTGTGTCCTGC 557 

Qy 74 9 ACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAAC 808 

MINI I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 558 CTTGTGTTCGTGCTGGGGATCATCGGGAACTCCACACTTCTGAGAATTATCTACAAGAAC 617 



Qy 809 TWVTGTATGAGGT^ATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATC 868 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 618 AAGTGCATGCGAAACGGTCCCAATATCTTGATCGCCAGCTTGGCTCTGGGAGACCTGCTG 677 

Qy 8 69 TATGTGGTCATTGATCTCCCTATCT^TGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTT 92 8 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 678 CACATCGTCATTGACATCCCTATCAATGTCTACAAGCTGCTGGCAGAGGACTGGCC 733 

Qy 92 9 GATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAG7\AGTCCTCG 98 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 734 ATTTGGAGCTGAGATGTGTAAGCTGGTGCCTTTCATACAGAAAGCCTCC 782 

Qy 989 GTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCC 104 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 783 GTGGGAATCACTGTGCTGAGTCTATGTGCTCTGAGTATTGACAGATATCGAGCTGTTGCT 842 

Qy 104 9 TCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCC 1108 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 84 3 TCTTGGAGTAGAATTAAAGGAATTGGGGTTCCTyW^TGGACAGCAGTAGAAATTGTTTTG 902 

Qy 1109 ATCTGGATCCTGTCCTTTATCCTGGCCATTCCTG7\AGCGATTGGCTTCGTCATGGTACCC 1168 

MINI III I I I I M I I I M I I I II II I I I I I II I I 

Db 903 ATTTGGGTGGTCTCTGTGGTTCTGGCTGTCCCTG7\AGCCATAGGTTTTGATATAATTACG 962 

Qy 1169 TTTGAATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCC ACATCAAAA 1222 

I II II I II II I I I II MM II II I II 

Db 963 ATGGACTACAAAGGAAGTTATCTGCGAATCTGCTTGCTTCATCCCGTTCAGTyVGACAGCT 1022 

Qy 1223 TTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATG 12 82 

II II I I II II II I I I II I M I I II II I I I II I II I II II I II I II 

Db 1023 TTCATGCAGTTTTACAAGACAGCA7WVGATTGGTGGCTATTCAGTTTCTATTTCTGCTTG 1082 

Qy 1283 CCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGG 1342 

Mini I I I I M I I I I I I I I I I I I I I I I I I I I I II I I II M I 

Db 1083 CCATTGGCCATCACTGCATTTTTTTATACACTAATGACCTGTGAAATGTTG AGAAAG 1139 

Qy 134 3 AATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCAAAA 14 02 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 114 0 AAAAGTGGCATGCAGATTGCTTTAAATGATCACCTAAAGCAGAGACGGGAAGTGGCCAAA 1199 

Qy 1403 ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGT 1462 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I i I I I I M I I 

Db 1200 ACCGTCTTTTGCCTGGTCCTTGTCTTTGCCCTCTGCTGGCTTCCCCTTCACCTCAGCAGG 1259 

Qy 1463 ATATTGAAGAAAACTGTGTATAACGTWVTGGACAAGTVACCGATGTGAATTACTTAGTTTC 1522 

II Mill I I I I I II I I II II II II I M I M I I I I I I 

Db 1260 ATTCTGAAGCTCACTCTTTATAATCAGAATGATCCCAATAGATGTGAACTTTTGAGCTTT 1319 

Qy 1523 TTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTAT71AACCCC 1582 

I III I I I I M I I I I I II I II I I II I I I I I I I I II I I I II II 
Db 1320 CTGTTGGTATTGGACTATATTGGTATCAACATGGCTTCACTGAATTCCTGCATTAACCCA 1379 

Qy 1583 ATAGCTCTGTATTTTGTGAGCAAGAT^TTTAAAAATTGTTTCCAGTCATGCCTCTGCTGC 1642 

II I M I I II I I I I I M I M I I I III Mill II M I I II I I I I I I I I II I 
Db 1380 ATTGCTCTGTATTTGGTGAGCAAAAGATTCAAAAACTGCTTTAAGTCATGCTTATGCTGC 1439 



Qy 



1643 TGCTG 1647 



Db 1440 TGGTG 1444 



RESULT 6 
US-08-121-446-3 

; Sequence 3, Application US/08121446 
; Patent No. 6313276 
GENERAL INFORMATION: 

APPLICANT: IMURA, HIROO 

APPLICANT: NAKAO, KAZUWA 

APPLICANT: NAKANISHI, SHIGETADA 

TITLE OF INVENTION: A HUMAN ENDOTHELIN RECEPTOR 
; NUMBER OF SEQUENCES: 4 
; CORRESPONDENCE ADDRESS: 

ADDRESSEE: MORRISON & FOERSTER 

STREET: 755 Page Mill Road 

CITY: Palo Alto 
; STATE: California 

COUNTRY: USA 

ZIP: 94304-1018 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentin Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/121,44 6 
FILING DATE: 
; CLASSIFICATION: 4 35 

PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: US 07/911,684 

FILING DATE: lO-JUL-1992 
ATTORNEY/AGENT INFORMATION: 
NAME: CIOTTI, THOMAS E. 
; REGISTRATION NUMBER: 21,013 

REFERENCE/ DOCKET NUMBER: 29900-20324.00 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (415) 813-5600 
; TELEFAX: (415) 494-0792 

TELEX: 706141 
INFORMATION FOR SEQ ID NO: 3: 
SEQUENCE CHARACTERISTICS: 
; LENGTH: 4301 base pairs 

; TYPE: nucleic acid 

STRANDEDNESS: single 
; TOPOLOGY: linear 

FEATURE : 

NAME/ KEY: CDS 
; LOCATION: 238.. 1566 

US-08-121-446-3 



Query Match 9.6%; 
Best Local Similarity 65.7%; 
Matches 634; Conservative 



Score 395.8; DB 4; Length 4301; 
Pred. No. 1.2e-93; 
0; Mismatches 307; Indels 24; Gaps 3 



689 TGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAATACATTAACACTGTGATATCTTGT 74 8 



Db 


505 


TGCCT^GGACCCATCGAGATCAAGGAGACTTTCAAATACATCAACACGGTTGTGTCCTGC 


564 


Ov 


749 


ACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAAC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 

CTTGTGTTCGTGCTGGGGATCATCGGGAACTCCACACTTCTGAGAATTATCTACAAGAAC 


808 


Db 


565 


624 


Ov 


809 


AAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AAGTGCATGCGT^AACGGTCCCAATATCTTGATCGCCAGCTTGGCTCTGGGAGACCTGCTG 


868 


Db 


625 


684 


Ov 


869 


TATGTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CACATCGTCATTGACATCCCTATCAATGTCTACAAGCTGCTGGCAGAGGACTGGCC 


928 


Db 


685 


740 


Ov 


929 


GATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ATTTGGAGCTGAGATGTGTAAGCTGGTGCCTTTCATACAGAAAGCCTCC 


988 


Db 


741 


789 


Ov 


989 


GTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTGGGAATCACTGTGCTGAGTCTATGTGCTCTGAGTATTGACAGATATCGAGCTGTTGCT 


1048 


Db 


790 


849 


Ov 


1049 


TCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M M 1 1 1 

TCTTGGAGTAGAATTAAAGGAATTGGGGTTCCAAAATGGACAGCAGTAGAAATTGTTTTG 


1108 


Db 


850 


909 


Ov 


1109 


ATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCC 

1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 
ATTTGGGTGGTCTCTGTGGTTCTGGCTGTCCCTGAAGCCATAGGTTTTGATATAATTACG 


1168 


Db 


910 


969 


Ov 


1169 


TTTGT^TATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCC ACATCAAAA 

1 1 1 II 1 II 11 II 1 1 1 1 II 1 II II 1 II 

ATGGACTACAAAGGAAGTTATCTGCGAATCTGCTTGCTTCATCCCGTTCAGAAGACAGCT 


1222 


Db 


970 


1029 


Ov 


1223 


TTCATGGAGTTCTACC7UVGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 II II 1 M 1 II 1 Ill II 

TTCATGCAGTTTTACAAGACAGCAAAAGATTGGTGGCTGTTCAGTTTCTATTTCTGCTTG 


1282 


Db 


1030 


1089 


Ov 


1283 


CCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGG 

II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 

CCATTGGCCATCACTGCATTTTTTTATACACTAATGACCTGTGAAATGTTG AGAAAG 


1342 


Db 


1090 


1146 


Ov 


1343 


AATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCAAAA 

II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 

AAAAGTGGCATGCAGATTGCTTTAAATGATCACCTAAAGCAGAGACGGGTyVGTGGCCAAA 


1402 


Db 


1147 


1206 


Qy 


1403 


ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
7\r'r'r"Tr'TTTTrrrTrrTrrTTr;TrTTT(^rrrTrTr;r'TGGCTTCCCCTTCACCTCAGCAGG 


1462 


DD 


1 o n "7 


1266 


Qy 


1463 


ATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGATGTGAATTACTTAGTTTC 

II 1 1 1 1 1 1 1 1 1 II 1 1 1 II 11 M 1 II II 1 M 1 1 1 1 1 1 
ATTCTGAAGCTCACTCTTTATAATCAGAATGATCCCAATAGATGTGAACTTTTGAGCTTT 


1522 


Db 


1267 


1326 


Qy 


1523 


TTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCC 


1582 



I III II II 1 1 II II II I 1 1 1 II II I I II II 1 1 1 1 1 1 1 1 1 II 



Db 1327 CTGTTGGTATTGGACTATATTGGTATCAACATGGCTTCACTGAATTCCTGCATTAACCCA 1386 



Qy 1583 ATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGC 1642 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I 

Db 1387 ATTGCTCTGTATTTGGTGAGCAAAAGATTCAAAAACTGCTTT7\AGTCATGCTTATGCTGC 144 6 

Qy 1643 TGCTG 1647 

I I I I 

Db 1447 TGGTG 1451 



RESULT 7 

PCT-US92-02091-1 

Sequence 1, Application PC/TUS9202091 
GENERj\L INFORMATION: 

APPLICANT: Battey Jr., James F. 
APPLICANT: Cor jay, Martha H. 
APPLICANT: Feldman, Richard I. 
APPLICANT: Harkins, Richard N. 

TITLE OF INVENTION: RECEPTORS FOR BOMBESIN-LIKE PEPTIDES 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Edwin P. Ching 
STREET: 1501 Harbor Bay Parkway 
CITY: Alameda 
STATE: CA 
COUNTRY: USA 
ZIP: 94501 
COMPUTER READABLE FORM:- 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentin Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/02091 
FILING DATE: 19920313 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER; US 07/426,150 
FILING DATE: 24-OCT-1989 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/533,659 
FILING DATE: 05-JUN-1990 
ATTORNEY/AGENT INFORMATION: 
NAME: Ching, Edwin P. 
REGISTRATION NUMBER: 34090 
REFERENCE/ DOCKET NUMBER: A-0092C 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 415-266-7476 
TELEFAX: 415-2 66-74 00 
INFORMATION FOR SEQ ID NO: 1: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1700 base pairs 
TYPE: NUCLEIC ACID 
STRANDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA to mRNA 



HYPOTHETICAL: NO 
0RIGIN7VL SOURCE: 

ORGANISM: Mus mus cuius 
CELL LINE: Swiss 3T3 
IMMEDIATE SOURCE: 

LIBRARY: Lambda GTIO 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 378., 1532 
PCT-US92-02091-1 

Query Match 2.5%; Score 101.8; DB 5; Length 1700; 

Best Local Similarity 49.3%; Pred. No. 1.4e-16; 

Matches 308; Conservative 0; Mismatches 302; Indels 15; Gaps 1; 

Qy 714 CAGCTTTCAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGG 773 

II I I I I II I I I I II I I I I III III Ml I II 

Db 4 90 CGGGCTTCATCTATGTCATCCCTGCAGTTTATGGGCTTATCATCGTGATAGGTCTTATTG 54 9 

Qy 774 GG7\ATGCAACTCTGCTCAGGATCATTTACCAGAAC7VAATGTATGAGGAATGGCCCCAACG 833 

III I I II I II I I I I I I I I I I I I I M I I I I I I I I I 

Db 550 GCAACATCACGCTCATCAAGATCTTCTGCACGGTCAAGTCCATGCGAAACGTGCCAAACC 609 

Qy 834 CGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCA 8 93 

I I II I II II I I I I I I I I I I I I I I II I I I I I I 

Db 610 TGTTCATCTCTAGCCTGGCTTTGGGAGACCTGCTGCTGCTGGTGACATGCGCCCCTGTGG 669 

Qy 894 ATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTC 953 

III Ml I I I I I II I I I II I I I I II I M 

Db 670 ATGCCAGCAAGTACCTGGCTGACAGGTGGCTA TTTGGCAGAATTG 714 

Qy 954 TTTGCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCT 1013 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II 

Db 715 GCTGCAAACTGATCCCCTTTATACAACTTACTTCAGTGGGGGTGTCTGTCTTCACACTTA 774 

Qy 1014 GCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGTSATTG 1073 

I I I I I I I I I I I II I I I I II III I I I I I II I 

Db 775 CGGCACTGTCAGCTGACAGGTACAAAGCCATTGTACGGCCAATGGATATCCAGGCATCCC 834 

Qy 1074 GGATTCCTTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGG 1133 

I M I I II II I I I I I I I M III I I Ml 

Db 835 ATGCCCTGATGAAGATCTGTCTCAAAGCTGCTTTGATCTGGATTGTCTCTATGTTGTTGG 8 94 

Qy 1134 CCATTCCTGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATA 1193 

I I I I II II M I I III I II I I I I II I II I 

Db 895 CCATCCCAGAGGCTGTGTTTTCTGACCTCCACCCCTTCCATGTGAAAGATACCAACCAAA 954 

Qy 1194 AAACCTGTATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACT 1253 

III II II I I I I I I I I I I I III I 

Db 955 CCTTCATTAGTTGTGCCCCCTACCCACACTCCAATGAGCTACACCCTAAAATCCATTCCA 1014 

Qy 1254 GGTGGCTCTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCC 1313 

I III III II I I I I I I I I I II I M I I II I I 

Db 1015 TGGCTTCCTTTCTGGTTTTCTACGTTATCCCACTGGCGATCATCTCTGTCTACTACTACT 1074 



Qy 



1314 TCATGACTTGTGAGATGTTGAACAG 1338 
MM I I I III III 



Db 1075 TCATTGCCCGAAATCTGATTCAGAG 109 9 



RESULT 8 

US-09-016-434-1215 

Sequence 1215, Application US/09016434 
Patent No. 6500938 
GENERAL INFORMATION: 

APPLICANT: Janice Au- Young 
APPLIC7\NT: Jeffrey J. Seilhamer 

TITLE OF INVENTION: COMPOSITION FOR THE DETECTION OF SIGNALING 
TITLE OF INVENTION: PATHWAY GENE EXPRESSION 
NUMBER OF SEQUENCES: 1490 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: INCYTE PHARMACEUTICALS, INC. 
STREET: 3174 PORTER DRIVE 
CITY: PALO ALTO 
STATE: CALIFORNIA 
COUNTRY: USA 
ZIP: 94304 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Word Perfect 6.1 for Windows /MS-DOS 6.2 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/016, 434 
FILING DATE: HEREWITH 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 
APPLICATION NUMBER: 
FILING DATE: 
CLASSIFICATION: 
ATTORNEY/AGENT INFORMATION: 
NAME: Zeller, Karen J. 
REGISTRATION NUMBER: 37,071 
REFERENCE/ DOCKET NUMBER: PA- 00 02 US 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (650) 855-0555 
TELEF7\X: (650) 845-4166 
INFORMATION FOR SEQ ID NO: 1215: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1726 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
IMMEDIATE SOURCE: 
LIBRARY: GENBANK 
CLONE: gl83649 
US-09-016-434-1215 

Query Match 2.2%; Score 91; DB 4; Length 1726; 

Best Local Similarity 48.3%; Pred. No. 9.9e-14; 

Matches 299; Conservative 0; Mismatches 305; Indels 15; Gaps 1; 

Qy 72 0 TCAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATG 77 9 

II II I I I I I I I I I I III I I III I I I I I I 



Db 514 TCCTCTATGTCATCCCTGCAGTTTATGGGGTTATCATTCTGATAGGCCTCATTGGCAACA 573 

Qy 780 CAACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGA 839 

I I I I I I I I I I I I I I I I I I II II I I I III 

Db 574 TCACTTTGATCAAGATCTTCTGTACAGTCAAGTCCATGCGAAACGTTCCAAACCTGTTCA 633 

Qy 840 TAGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTAT 899 

I I I I I I I I I I I I I I I I I I I II I II I II I III 

Db 634 TTTCCAGTCTGGCTTTGGGAGACCTGCTCCTCCTAATAACGTGTGCTCCAGTGGATGCCA 693 

Qy 900 TTAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCA 959 

II M II I I I I M I I I I I I I I I I I I I I 

Db 694 GCAGGTACCTGGCTGACAGATGGCTATTTGGCAGGATTGGC TGCA 738 

Qy 960 AGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTC 1019 

I I I I I II I II I I I I I I I I II II I I I I I III I II III III 

Db 739 AACTGATCCCCTTTATACAGCTTACCTCTGTTGGGGTGTCTGTCTTCACACTCACGGCGC 798 

Qy 102 0 TTAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTC 1079 

I I I II II I I II I II I I I I I I I I I II I 

Db 799 TCTCGGCAGACAGATACA7\AGCCATTGTCCGGCCAATGGATATCCAGGCCTCCCATGCCC 8 58 

Qy 108 0 CTTTGGTAACTGCCATTGTW^TTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTC 1139 

II I II II III I I I I I II I I I M I I I II I I II I I I I 

Db 859 TGATGAAGATCTGCCTCAAAGCCGCCTTTATCTGGATCATCTCCATGCTGCTGGCCATTC 918 

Qy 114 0 CTGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAA7UVCCT 1199 

I I I I I I I I I I I I I I I I I I I I I I I 

Db 919 CAGAGGCCGTGTTTTCTGACCTCCATCCCTTCCATGAGGAAAGCACCAACCAGACCTTCA 97 8 

Qy 12 00 GTATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGC 1259 

II I I I I I I I I I I I I I III I 

Db 97 9 TTAGCTGTGCCCCATACCCACACTCTAATGAGCTTCACCCCAAAATCCATTCTATGGCTT 1038 

Qy 1260 TCTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGA 1319 

III I I II II I I I I II I II I I I I I I I I I I I I 

Db 1039 CCTTTCTGGTCTTCTACGTCATCCCACTGTCGATCATCTCTGTTTACTACTACTTCATTG 10 98 

Qy 1320 CTTGTGAGATGTTG7VACAG 1338 

II I III III 

Db 1099 CTAAAAATCTGATCCAGAG 1117 



RESULT 9 

PCT-US92-02091-3 

; Sequence 3, Application PC/TUS92 02091 

; GENERAL INFORMATION: 

; APPLICANT: Battey Jr., James F. 

APPLICANT: Cor jay, Martha H. 

APPLICANT: Feldman, Richard I. 

APPLICANT: Harkins, Richard N. 

TITLE OF INVENTION: RECEPTORS FOR BOMBESIN-LIKE PEPTIDES 
NUMBER, OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Edwin P. Ching 

STREET: 1501 Harbor Bay Parkway 

CITY: Alameda 



STATE: CA 
; COUNTRY: USA 

; ZIP: 94501 

; COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Patentin Release #1.0, Version #1.25 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/02091 

FILING DATE: 19920313 
; CLASSIFICATION: 435 

PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/426,150 

FILING DATE: 24-OCT-1989 
; PRIOR APPLICATION DATA: 

; APPLICATION NUMBER: US 07/533,659 

FILING DATE: 05-JUN-1990 
; ATTORNEY/AGENT INFORMATION: 

NAME: Ching, Edwin P. 

REGISTRATION NUMBER: 34090 

REFERENCE/ DOCKET NUMBER: A-0092C 
; TELECOMMUNICATION INFORMATION: 

; TELEPHONE: 415-266-7476 

TELEFAX: 415-266-7400 
; INFORMATION FOR SEQ ID NO: 3: 

SEQUENCE CHARACTERISTICS: 
; LENGTH: 1726 base pairs 

TYPE: NUCLEIC ACID 

STRANDEDNESS: double 

TOPOLOGY: linear 
; MOLECULE TYPE: cDNA to mRNA 
HYPOTHETICAL: NO 
ORIGINAL SOURCE: 
; ORGANISM: Homo sapiens 

; CELL TYPE: Small cell lung carcinoma 

CELL LINE: NCI-H345 
IMMEDIATE SOURCE: 
; LIBRARY: Lambda GTIO 

FEATURE : 

NAME/ KEY: CDS 

LOCATION: 399.. 1553 
PCT-US92-02091-3 

Query Match 2.2%; Score 91; DB 5; Length 1726; 

Best Local Similarity 48.3%; Pred. No. 9.9e-14; 

Matches 299; Conservative 0; Mismatches 305; Indels 15; Gaps 1 

Qy 720 TCAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATG 77 9 

II II I I I I I I I I I I III I I III I I I I II 
Db 514 TCCTCTATGTCATCCCTGCAGTTTATGGGGTTATCATTCTGATAGGCCTCATTGGCTVACA 573 

Qy 780 CAACTCTGCTCAGGATCATTTACCAG7UVCAAATGTATGAGGAATGGCCCCAACGCGCTGA 839 

II I I I I I I I II I II INI I II I II I I I I I I III 

Db 574 TCACTTTGATCAAGATCTTCTGTACAGTCAAGTCCATGCGAAACGTTCCAAACCTGTTCA 633 



84 0 TAGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTAT 8 99 



I 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II I II I II I III 

Db 634 TTTCCAGTCTGGCTTTGGGAGACCTGCTCCTCCTAATAACGTGTGCTCCAGTGGATGCCA 693 

Qy 900 TTAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCA 959 

II I I I I I II I I II I I I M I II I UN 

Db 694 GCAGGTACCTGGCTGACAGATGGCTATTTGGCAGGATTGGC TGCA 738 

Qy 960 AGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTC 1019 

I I M I I I I I I I I I I I I III II I I II M 

Db 739 AACTGATCCCCTTTATACAGCTTACCTCTGTTGGGGTGTCTGTCTTCACACTCACGGCGC 7 98 

Qy 1020 TTAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTC 1079 

I I M I M I I II I I I I I I I I I I I I II I 

Db 7 99 TCTCGGCAGACAGATACAAAGCCATTGTCCGGCCAATGGATATCCAGGCCTCCCATGCCC 85 8 

Qy 108 0 CTTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTC 1139 

M I II II III I M M II I I I I I I I I I M I I I I I M 

Db 859 TGATGAAGATCTGCCTCAAAGCCGCCTTTATCTGGATCATCTCCATGCTGCTGGCCATTC 918 

Qy 114 0 CTGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCT 1199 

I I I II I I I I I I I I I I I I I I II I I 

Db 919 CAGAGGCCGTGTTTTCTGACCTCCATCCCTTCCATGAGGAAAGCACCAACCAGACCTTCA 97 8 

Qy 1200 GTATGCTCiDATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGC 1259 

II I I I I I I II I I I I I III I 

Db 979 TTAGCTGTGCCCCATACCCACACTCTAATGAGCTTCACCCCAAAATCCATTCTATGGCTT 1038 

Qy 1260 TCTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGA 1319 

III I I I I II I I I I II I II I I I I I II I I I I I 

Db 1039 CCTTTCTGGTCTTCTACGTCATCCCACTGTCGATCATCTCTGTTTACTACTACTTCATTG 1098 

Qy 1320 CTTGTGAGATGTTGAACAG 1338 

II I II I I I I 

Db 1099 CTAAAAATCTGATCCAGAG 1117 



RESULT 10 
US-09-120-772-1 

; Sequence 1, Application US/09120772 
; Patent No. 6143521 

GENERAL INFORMATION: 

APPLICANT: LANE, PAMELA 

APPLICANT: TSUI, PING 

APPLICANT: ELSHOURBAGY, NABIL 

TITLE OF INVENTION: HUMAN BOMBESIN RECEPTOR SUBTYPE 
TITLE OF INVENTION: 3 
; NUMBER OF SEQUENCES: 2 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Ratner & Prestia 
; STREET: P.O. Box 980 

CITY: Valley Forge 
STATE: PA 
COUNTRY: USA 
ZIP: 19482 
; COMPUTER READABLE FORM: 

MEDIUM TYPE: Diskette 
; COMPUTER: IBM Compatible 



OPERATING SYSTEM: DOS 

SOFTWARE: FastSEQ for Windows Version 2.0 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/120,772 

FILING DATE: 22-JUL-1998 

CLASSIFICATION: 
; PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 

FILING DATE: 
ATTORNEY/AGENT INFORMATION: 

N7\ME: Prestia, Paul F 
; REGISTRATION NUMBER: 23,031 

; REFERENCE/DOCKET NUMBER: GP-70505 

TELECOMMUNICATION INFORMATION: 

TELEPHONE: 610-407-0700 

TELEFAX: 610-407-0700 

TELEX: 846169 
; INFORMATION FOR SEQ ID NO: 1: 
; SEQUENCE CH7VRACTERISTICS : 

LENGTH: 1205 base pairs 

TYPE; nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
US-09-120-772-1 



Query Match 1.9%; Score 79.6; DB 3; Length 1205; 

Best Local Similarity 46.9%; Pred. No. 8.1e-ll; 

Matches 419; Conservative 0; Mismatches 439; Indels 36; Gaps 4; 

Qy 7 61 GTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGG 82 0 

I I I I I I I I I I I I I I I I I I I III I I I I I I I M M I I I III 

Db 18 0 GTGGGCATCCTTGGAAATGCTATTCTCATCAAAGTCTTTTTCAAGACCAAATCCATGCAA 239 

Qy 821 AATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATT 88 0 

I I II I I III I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 0 ACAGTTCCAAATATTTTCATCACCAGCCTGGCTTTTGGAGATCTTTTACTTCTGCTAACT 299 

Qy 881 GATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGAC 940 

I I II I I I I I II I I I I I I I I I I II 

Db 300 TGTGTGCCAGTGGATGCAACTCACTACCTTGCAGAAGGATGGCTGTTC 34 7 

Qy 941 TTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACC 1000 

II IN I II M I I I I I I I I III I M I I I I I I 

Db 34 8 GGAAGAATTGGTTGTAAGGTGCTCTCTTTCATCCGGCTCACTTCTGTTGGTGTGTCA 404 

Qy 1001 GTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGT 1060 

II III I I I I I I I I I I I I I M I I I I I I I I I I 

Db 405 GTGTTCACATTAGCAATTCTCAGCGCTGACAGATACAAGGCAGTTGTGAAGCCACTTGAG 464 

Qy 1061 GTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTG 1120 

III II IN I I I I I I I I I I I II I I I M 

Db 465 CGACAGCCCTCCAATGCCATCCTGAAGACTTGTGTAAAAGCTGGCTGCGTCTGGATCGTG 524 



Qy 1121 TCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGG 118 0 

II III III I I I I I I I I I I I I INI Ml 

Db 525 TCTATGATATTTGCTCTACCTGAGGCTATATTTTCAAATGTATACACTTTTCGAGATCCC 584 



Qy 1181 GGTG7UVCAGCATAAAACCTGTATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAA 1240 

I I I I II I I I I I I I I I I I I I I 

Db 585 AATAA7\i\ATATGACATTTGAATCATGTACCTCTTATCCTGTCTCTAAGAAGCTCTTGCAA 644 

Qy 1241 GATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCG 1300 

I I I I I I I I II I I I I I II I I I I I I 

Db 645 GAAATACATTCTCTGCTGTGCTTCTTAGTGTTCTACATTATTCCACTCTCTATTATCTCT 704 

Qy 1301 ATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATT 1360 

I I I I I I I I I II I I I I I II I I I II I 

Db 7 05 GTCTACTATTCCTTGATTGCTAGGACCCTTTACAAAAGCACCCTGAACATACCTACTGAG 7 64 

Qy 1361 GCCCTCAGTGAACATCTTAAGCAG CGTCGAGAAGTGGCAAAAACAGTTTTC 1411 

I I I I I I I I I I II I II I I I I I I I I I I M 

Db 7 65 GAACAT^GCCATGCCCGTAAGCAGATTGAATCCCGAAAGAGAATTGCCAGAACGGTATTG 824 

Qy 1412 TGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGTATATTGAAG 1471 

I I I I I I I I I I I I I I I I I I II M I I Mill I I I I I I 

Db 82 5 GTGTTGGTGGCTCTGTTTGCCCTCTGCTGGTTGCC7V7UVTCACCT— CCTGTACCTCTACC 8 82 

Qy 1472 AAAACTGTGTATAACG7WVTGGACAAGAACCGATGTGAATTACTTAGTTTCTTACTGCTC 1531 

I I I I I I I I I I I II II I I I I I I 

Db 883 ATTCATTCACTTCTCAAACCTATGTAGACCCCTCTGCCATGCATTTCATTTTCACCATT- 941 

Qy 1532 ATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCCATAGCTCTG 1591 

II I I I I I I II I M I I I I I I I I I I I I I I I II I 

Db 942 TTCTCTCGGGTTTTGGCTTTCAGCAATTCTTGCGTAAACCCCTTTGCTCTC 992 

Qy 1592 TATTTTGTGAGCT^GAAATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGCTGC 1645 

III I I I I M I I M III III I I I I I I I I M 

Db 993 TACTGGCTGAGCA7WVGCTTCCAGAAGCATTTTAAAGCTCAGTTGTTCTGTTGC 1046 



RESULT 11 

US-09-016-434-1275 

; Sequence 1275, Application US/09016434 

; Patent No. 6500938 

; GENERAL INFORMATION: 

; APPLICANT: Janice Au- Young 

; APPLICANT; Jeffrey J. Seilhamer 

TITLE OF INVENTION: COMPOSITION FOR THE DETECTION OF SIGNALING 
TITLE OF INVENTION: PATHWAY GENE EXPRESSION 
NUMBER OF SEQUENCES: 1490 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: INCYTE PHARMACEUTICALS, INC. 
; STREET: 3174 PORTER DRIVE 

CITY: PALO ALTO 
STATE: CALIFORNIA 
COUNTRY: USA 
ZIP: 94304 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

OPERATING SYSTEM; PC-DOS/MS-DOS 
; SOFTWARE: Word Perfect 6.1 for Windows /MS-DOS 6.2 

; CURRENT APPLICATION DATA: 



APPLICATION NUMBER: US/09/016, 434 
FILING DATE: HEREWITH 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 
APPLICATION NUMBER: 
FILING DATE: 
CLASSIFICATION: 
ATTORNEY/AGENT INFORMATION: 
NAME: Zeller, Karen J. 
REGISTRATION NUMBER: 37,071 
REFERENCE/ DOCKET NUMBER: PA- 00 02 US 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (650) 855-0555 
TELEFAX: (650) 845-4166 
INFORMATION FOR SEQ ID NO: 1275: 
SEQUENCE CH7VRACTERISTICS: 
LENGTH: 1413 base pairs 
TYPE: nucleic acid 
STR/y^DEDNESS : single 
TOPOLOGY: linear 
IMMEDIATE SOURCE: 
LIBRARY: GENBANK 
CLONE: g291876 
US-09-016-434-1275 

Query Match 1.9%; Score 79.6; DB 4; Length 1413; 

Best Local Similarity 46.9%; Pred. No. 8.8e-ll; 

Matches 419; Conservative 0; Mismatches 439; Indels 36; Gaps 4; 

Qy 7 61 GTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGG 82 0 

I I I I I I I I I I I I I I I I I I I III II I II I I I I I I I I I III 

Db 327 GTGGGCATCCTTGGA7VATGCTATTCTCATCAAAGTCTTTTTCAAGACCAAATCCATGCAA 38 6 

Qy 821 AATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATT 880 

I I I I I I III I I I I I I II I I II I I I I I I I I I I I I I 

Db 387 ACAGTTCCAAATATTTTCATCACCAGCCTGGCTTTTGGAGATCTTTTACTTCTGCTAACT 44 6 

Qy 8 81 GATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGAC 94 0 

I I I I I I I I I II I I I I I I I I I I II 

Db 447 TGTGTGCCAGTGGATGCAACTCACTACCTTGCAGAAGGATGGCTGTTC 4 94 

Qy 941 TTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACC 1000 

II III I I I I I I I I I I I II III I 11 I I I I I I 

Db 4 95 GGAAGAATTGGTTGTAAGGTGCTCTCTTTCATCCGGCTCACTTCTGTTGGTGTGTCA 551 

Qy 1001 GTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGT 1060 

II III I I I I I I I I I I II I I I I I I I II I I I I 

Db 552 GTGTTCACATTAACAATTCTCAGCGCTGACAGATAC7\AGGCAGTTGTGAAGCCACTTGAG 611 

Qy 1061 GTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTG 1120 

III II III I II I I I I I I I I I I I I I I I 

Db 612 CGACAGCCCTCCAATGCCATCCTGAAGACTTGTGTAAAAGCTGGCTGCGTCTGGATCGTG 671 

Qy 1121 TCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGG 118 0 

II III III I I I I I I I I I I I IN 

Db 672 TCTATGATATTTGCTCTACCTGAGGCTATATTTTCAAATGTATACACTTTTCGAGATCCC 731 



Qy 1181 GGTG7\ACAGCAT7\AAACCTGTATGCTC7^TGCCACATC7W\ATTCATGGAGTTCTACCAA 1240 

I I I I II I I I I I I I I I I I I I I 

Db 732 AATAAAAATATGACATTTGAATCATGTACCTCTTATCCTGTCTCTAAGAAGCTCTTGCAA 791 

Qy 1241 GATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCG 1300 

I I I I I I I I II I I I I I I M II I I I 

Db 7 92 GAAATACATTCTCTGCTGTGCTTCTTAGTGTTCTACATTATTCCACTCTCTATTATCTCT 851 

Qy 1301 ATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAG7\AGGAATGGCAGCTTGAGAATT 1360 

I I I I I I II I I I I I I I I II I I I II I 

Db 852 GTCTACTATTCCTTGATTGCTAGGACCCTTTACAAAAGCACCCTGAACATACCTACTGAG 911 

Qy 1361 GCCCTCAGTGAACATCTTAAGCAG CGTCGAGAAGTGGCAAAAACAGTTTTC 1411 

I I II I I I I I I I I I II I I I I I I I I I I I I 

Db 912 GAACAAAGCCATGCCCGTAAGCAGATTG7\ATCCCGAAAGAGAATTGCCAGAACGGTATTG 971 

Qy 1412 TGCTTGGTTGTT^ATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGTATATTGAAG 1471 

I I I I I I I I I I I I I I I I II I I I I II I I I I I INI I I 

Db 972 GTGTTGGTGGCTCTGTTTGCCCTCTGCTGGTTGCCAAATCACCT — CCTGTACCTCTACC 102 9 

Qy 1472 AAAACTGTGTATAACGAAATGGACAAG7\ACCGATGTGAATTACTTAGTTTCTTACTGCTC 1531 

I I I I M I I I I I II II I I I I I I 

Db 1030 ATTCATTCACTTCTCAAACCTATGTAGACCCCTCTGCCATGCATTTCATTTTCACCATT- 1088 

Qy 1532 ATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCCATAGCTCTG 1591 

II I I II I I M I I I I I II I I I I I I I I I II I I I 

Db 1089 TTCTCTCGGGTTTTGGCTTTCAGCAATTCTTGCGTA7\ACCCCTTTGCTCTC 1139 

Qy 1592 TATTTTGTGAGC7yVGA7\ATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGCTGC 1645 

Ml I II I I M I II IN III I I I I I I I I I I 

Db 1140 TACTGGCTGAGCAAAAGCTTCCAGAAGCATTTTAAAGCTCAGTTGTTCTGTTGC 1193 



RESULT 12 

US-09-016-434-1233 

; Sequence 1233, Application US/09016434 

; Patent No. 6500938 

; GENERAL INFORMATION: 

; APPLICANT: Janice Au- Young 

; APPLICANT: Jeffrey J. Seilhamer 

TITLE OF INVENTION: COMPOSITION FOR THE DETECTION OF SIGNALING 
TITLE OF INVENTION: PATHWAY GENE EXPRESSION 
NUMBER OF SEQUENCES: 14 90 
; CORRESPONDENCE ADDRESS: 

ADDRESSEE: INCYTE PHARMACEUTICALS, INC. 
; STREET: 3174 PORTER DRIVE 

CITY: PALO ALTO 
; STATE: CALIFORNIA 

COUNTRY: USA 
ZIP: 94304 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
; COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: Word Perfect 6.1 for Windows /MS-DOS 6.2 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/09/016,434 



FILING DATE: HEREWITH 
CLASSIFICATION: 
PRIOR APPLICATION DATA: 
APPLICATION NUMBER: 
FILING DATE: 
CLASSIFICATION: 
ATTORNEY/AGENT INFORMATION: 
NAME: Zeller, Karen J. 
REGISTRATION NUMBER: 37,071 
REFERENCE/ DOCKET NUMBER: PA- 00 02 US 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (650) 855-0555 
TELEFAX: (650) 845-4166 
INFORMATION FOR SEQ ID NO: 1233: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1352 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
IMMEDIATE SOURCE: 
LIBRARY: GENBANK 
CLONE: gl89241 
US-09-016-434-1233 

Query Match 1.7%; Score 68.6; DB 4; Length 1352; 

Best Local Similarity 50.1%; Pred. No. 6.7e-08; 

Matches 210; Conservative 0; Mismatches 194; Indels 15; Gaps 1; 

Qy 752 ATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAACAAA 811 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM 

Db 296 ATCATCACCGTGGGCTTGCTGGGCAACATCATGCTGGTGAAGATCTTCATCACCAACAGC 355 

Qy 812 TGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATCTAT 871 

M I II II I M M M I III II MM II M I t I 

Db 356 GCCATGAGGAGCGTCCCCAACATCTTCATCTCTAACCTGGCGGCCGGGGACTTGCTGCTG 415 

Qy 872 GTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTTGAT 931 

I I II I MM Ml II II I II MM 

Db 416 CTGCTCACCTGCGTCCC GGTGGACGCCTCGCGCTACTTCTTCGAC 460 

Qy 932 CACAATGACTTTGGCGTATTTCTTTGCTU^^GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTG 991 

I I II I II I M I M II I II II I MM I II II I 

Db 461 GAGTGGATGTTTGGCAAGGTGGGCTGCAAACTGATCCCTGTCATCCAGCTCACTTCCGTG 520 

Qy 992 GGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCCTCC 1051 

[Ml I I I I II I II I II M I M I I M I M M II I II M I 

Db 521 GGGGTTTCCGTGTTCACTCTCACTGCCCTCAGCGCCGACAGGTACAGAGCCATCGTTAAC 58 0 

Qy 1052 TGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCCATC 1111 

I MM III I I II II I Ml 

Db 581 CCCATGGACATGCAGACGTCAGGGGCATTGCTGCGGACCTGTGTGAAGGCCATGGGTATC 640 

Qy 1112 TGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCCTT 117 0 

MM II M I II II II II M II M M I I I III I II 

Db 641 TGGGTGGTCTCCGTGTTGCTGGCAGTTCCCGAAGCGGTGTTTTCAG7UVGTGGCTCGCAT 699 



RESULT 13 
PCT-US92-02091-7 

Sequence 1, Application PC/TUS9202091 
GENERAL INFORMATION: 

APPLICANT: Battey Jr., James F. 
APPLICANT: Corjay, Martha H. 
APPLICANT: Feldman, Richard I. 
APPLICANT: Harkins, Richard N. 

TITLE OF INVENTION: RECEPTORS FOR BOMBESIN-LIKE PEPTIDES 
NUMBER OF SEQUENCES: 8 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: Edwin P. Ching 
STREET: 1501 Harbor Bay Parkway 
CITY: Alameda 
STATE: CA 
COUNTRY: USA 
ZIP: 94501 
COMPUTER READ7VBLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: PatentIn Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/ 02091 
FILING DATE: 19920313 
CLASSIFICATION: 4 35 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/426,150 
FILING DATE: 24-OCT-1989 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/533,659 
FILING DATE: 05-JUN-1990 
ATTORNEY/AGENT INFORMATION: 
NAME: Ching, Edwin P. 
REGISTRATION NUMBER: 34090 
REFERENCE/ DOCKET NUMBER: A-0092C 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 415-266-7476 
TELEFAX: 415-266-74 00 
INFORMATION FOR SEQ ID NO: 7: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 1352 base pairs 
TYPE: NUCLEIC ACID 
STR7\NDEDNESS : double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA to mRNA 
HYPOTHETICAL: NO 
ORIGINAL SOURCE: 

ORGANISM: Homo sapiens 
CELL TYPE: Small cell lung carcinoma 
CELL LINE: NCI-H345 
FEATURE : 

NAME/KEY: CDS 
LOCATION: 140, .1312 
PCT-US92-02091-7 



Query Match 



1.7%; Score 68.6; DB 5; Length 1352; 



Best Local Similarity 50.1%; Pred. No. 6.7e-08; 

Matches 210; Conservative 0; Mismatches 194; Indels 15; Gaps 1; 
Qy 752 ATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAACAAA 811 

II I I I M I I I I MM I I M I I I I MM 

Db 296 ATCATCACCGTGGGCTTGCTGGGCAACATCATGCTGGTGAAGATCTTCATCACCAACAGC 355 

Qy 812 TGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATCTAT 871 

I I I I I M M MM I 

Db 356 GCCATGAGGAGCGTCCCCAACATCTTCATCTCTAACCTGGCGGCCGGGGACTTGCTGCTG 415 

Qy 872 GTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTTGAT 931 

M M I MM Ml II II II I MM 

Db 416 CTGCTCACCTGCGTCCC GGTGGACGCCTCGCGCTACTTCTTCGAC 460 

Qy 932 CACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTG 991 

I I I II II I II II I I M II I I I MM II II II 

Db 461 GAGTGGATGTTTGGCAAGGTGGGCTGCAAACTGATCCCTGTCATCCAGCTCACTTCCGTG 52 0 

Qy 992 GGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCCTCC 1051 

I II I II I I II I Ml II II I M I M I II M II II I I II I 

Db 521 GGGGTTTCCGTGTTCACTCTCACTGCCCTCAGCGCCGACAGGTACAGAGCCATCGTTAAC 58 0 

Qy 1052 TGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCCATC 1111 

I MM Ml MM II I I II 

Db 581 CCCATGGACATGCAGACGTCAGGGGCATTGCTGCGGACCTGTGTGAAGGCCATGGGTATC 64 0 

Qy 1112 TGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCCTT 1170 

MM Mill II II I I II II II II II I I I Ml III 

Db 641 TGGGTGGTCTCCGTGTTGCTGGCAGTTCCCGAAGCGGTGTTTTCAGAAGTGGCTCGCAT 699 



RESULT 14 
PCT-US92-02091-5 

; Sequence 5, Application PC/TUS9202091 

; GENERAL INFORMATION: 

; APPLICANT: Battey Jr.^ James F. 

APPLICANT: Cor jay, Martha H. 
; APPLIC7\NT: Feldman, Richard I. 
; APPLICANT: Harkins, Richard N. 

TITLE OF INVENTION: RECEPTORS FOR BOMBESIN-LIKE PEPTIDES 
NUMBER OF SEQUENCES: 8 
; CORRESPONDENCE ADDRESS: 

; ADDRESSEE: Edwin P. Ching 

STREET: 1501 Harbor Bay Parkway 
CITY: TVlameda 
; STATE: CA 

COUNTRY: USA 
ZIP: 94501 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
; SOFTWARE: PatentIn Release #1.0, Version #1.25 

CURRENT APPLICATION DATA: 

APPLICATION NUMBER: PCT/US92/ 02 091 
FILING DATE: 19920313 



CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/426,150 
FILING DATE: 24-OCT-1989 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 07/533,659 
FILING DATE: 05-JUN-1990 
; ATTORNEY/AGENT INFORMATION: 

NAME: Ching, Edwin P. 
; REGISTRATION NUMBER: 34090 

REFERENCE/DOCKET NUMBER: A-0092C 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: 415-266-7476 
; TELEFAX: 415-266-7400 

INFORMATION FOR SEQ ID NO: 5: 
SEQUENCE CHARACTERISTICS: 
; LENGTH: 1584 base pairs 

; TYPE: NUCLEIC ACID 

STRANDEDNESS: double 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA to mRNA 
HYPOTHETICAL: NO 
ORIGINAL SOURCE: 

ORGANISM: Rattus rattus 
; TISSUE TYPE: Esophagus 

FEATURE: 

NAME/KEY: CDS 
LOCATION: 132.. 1304 
PCT-US92-02091-5 

Query Match 1.6%; Score 65.8; DB 5; Length 1584; 

Best Local Similarity 49.6%; Pred. No. 4e-07; 

Matches 209; Conservative 0; Mismatches 197; Indels 15; Gaps 1; 



Qy 



752 ATTTTCATCGTGGGAATGGTGGGG7VATGCAACTCTGCTCAGGATCATTTACCAGAACA7\A 811 



Db 



2 88 ATCATCTCGGTGGGCTTGCTGGGCAACATCATGCTGGTG7\AGATATTCCTCACCAACAGC 347 



Db 



812 TGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATCTAT 871 

I M I I I I I I I I I I I I III II I I I I II I I I II I I 

34 8 ACCATGCGGAGTGTCCCCAACATCTTCATCTCTAACCTGGCTGCGGGAGACCTGCTGCTG 4 07 



Qy 



Db 



872 GTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTTGAT 931 

I I I I I I II I I I I I I I I II I I I I 

408 CTGCTGACCTGCGTCCCAGTGGATGCCTCC CGATACTTCTTTGAT 452 



Qy 



Db 



932 CACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTTTGCAGAAGTCCTCGGTG 991 

I I I I I II I I M I I II I I II I I I I I II I II I I 

453 GAATGGGTGTTCGGCAAGCTGGGCTGCAAACTCATCCCAGCCATCCAGCTCACCTCGGTG 512 



Qy 



992 GGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCCTCC 1051 




Db 



513 GGGGTTTCCGTGTTCACTCTCACGGCCCTCAGCGCTGACAGGTACAGAGCTATCGTGAAC 572 



Qy 1052 TGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCCATC 1111 

I I I II Mil II II II M I I II 

Db 573 CCCATGGACATGCAGACGTCTGGTGTGGTGCTGTGGACCAGTTTGAAGGCCGTGGGCATC 632 



Qy 1112 TGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCCTTT 1171 

I I I I III I I I I II 11111111 I I I I I I I I I 

Db 633 TGGGTGGTCTCTGTGCTGTTGGCTGTCCCTGAGGCTGTGTTTTCGGAAGTAGCACGCATC 692 

Qy 1172 G 1172 

I 

Db 693 G 693 



RESULT 15 
US-08-279-590A-1 

; Sequence 1, Application US/08279590A 

; Patent No. 5656749 

; GENERAL INFORMATION: 

APPLIC7\NT: ELIOT R. SPINDEL, SRINIVASA 
; APPLICANT: NAGALLA AND BRENDA BARRY 

TITLE OF INVENTION: NUCLEIC ACIDS ENCODING 
TITLE OF INVENTION: RECEPTORS FOR BOMBESIN-LIKE 
TITLE OF INVENTION: PEPTIDES 
NUMBER OF SEQUENCES: 10 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Fish & Richardson 

STREET: 225 Franklin Street 
CITY: Boston 
; STATE: Massachusetts 

; COUNTRY: U.S.A. 

ZIP: 02110-2804 
COMPUTER READABLE FORM: 
; MEDIUM TYPE: 3.5" Diskette, 1.44 Mb 

COMPUTER: IBM PS/2 Model 50Z or 55SX 
; OPERATING SYSTEM: MS-DOS (Version 5.0) 

S0FTW7VRE: WordPerfect (Version 5.1) 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/279, 590A 
FILING DATE: July 22, 1994 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 
; APPLICATION NUMBER: No. 5656749e 

FILING DATE: 
ATTORNEY/AGENT INFORMATION: 
N7\ME: Y. Rocky Tsao 
REGISTRATION NUMBER: 34,053 
REFERENCE/ DOCKET NUMBER: 00537/098001 
; TELECOMMUNICATION INFORMATION: 

; TELEPHONE: (617) 542-5070 

TELEFAX: (617) 542-8906 
TELEX: 200154 
; INFORMATION FOR SEQ ID NO: 1: 
; SEQUENCE CHARACTERISTICS: 

; LENGTH: 1563 

; TYPE: nucleic acid 

STRANDEDNESS: single 
TOPOLOGY: linear 
US-08-279-590A-1 



Query Match 



1.5%; Score 63.6; DB 1; Length 1563; 



Best Local Similarity 45.5%; Pred. No. 1.5e-06; 

Matches 332; Conservative 0; Mismatches 374; Indels 24; Gaps 2; 

Qy 735 CTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGA 794 

I I I I I I I I I I I I I I I I I I I I I I I I I III II II 

Db 34 0 CTGTCACATATGCTGTTATTATTTCTGTCGGTATCCTTGGAAACACAATACTTATAAAAG 399 

Qy 795 TCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCC 854 

I III I I I I I I III I I II I I I I III I M 

Db 4 00 TATTTTTTAAAATCAAGTCAATGCAGACTGTTCCTAATATTTTCATCACCAGCCTGGCTT 459 

Qy 855 TTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTTVAGCTGCTGGCTG 914 

II II I I I I I I I I I I I III I 

Db 4 60 TTGGAGATCTTCTTCTACTGCTGACCTGCGTGCCAGTGGACGCATCTCGGTATATTGTGG 519 

Qy 915 GGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTGTTCCCCTTTT 974 

Ml I I I I I I I I I II I I I I I I I 

Db 52 0 ACACGTGGATGTTTGG71AGAGCTGGCTGT AAGATAATTTCCTTCA 564 

Qy 975 TGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGT 1034 

I I I I I I I I II I I I III II I I II I I I I I I I I I I I 

Db 565 TACAGCTTACCTCTGTCGGAGTGTCGGTGTTTACTTTAACTGTCCTCAGTACTGACAGGT 624 

Qy 1035 ACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCA 1094 

II II I I I I I I I I I I I I I I I I II 

Db 625 ACAGAGCCATTGTGAAACCCTTGCAATTGCAGACCTCAGATGCCGTTTTGAAGACATGTG 684 

Qy 1095 TTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCT 1154 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 68 5 GCAAAGCTGTTTGTGTTTGGATCATTTCCATGCTCCTCGCTGCTCCAG7VAGCTGTGTTCT 744 

Qy 1155 TCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCCA 1214 

III I I I I I I II I I II 

Db 745 CAGATTTGTATGAATTTGGCAGCTCGGAAAAAAATACCACTTTTGAAGCCTGTGCTCCAT 804 

Qy 1215 CATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATT 1274 

II I III I I I I I II I I I I I I I I I 

Db 8 05 ATCCAGTCTCTGAAAAGATTCTGCAAGAGACACATTCCCTAATATGCTTCCTGGTATTCT 8 64 

Qy 1275 TCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGA 1334 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 865 ACATTGTTCCCCTGTC7\ATCATTTCTGCATATTACTTCCTTATTGCAAAAACCCTGTACA 924 

Qy 1335 A CAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGC 1385 

I I I I I I I I I I I I I I I I I I I II 

Db 925 AAAGTACTTTCAACATGCCTGCTGAAGAGCACACTCACGCCCGTUKAACAGATAGAATCGC 984 

Qy 1386 GTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCC 14 45 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 985 GCAAACGAGTGGCAAAAACTGTGTTGGTGTTGGTGGCATTGTTCGCAGTGTGCTGGTTGC 1044 

Qy 144 6 CTCTTCACTT 1455 

I I I I I 

Db 1045 CAAACCACAT 1054 



Search completed: May 14, 2004, 15:54:32 



Job time : 263.426 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



nucleic search, using sw model 

May 14, 2004, 10:14:36 ; Search time 1559.76 Seconds 

(without alignments) 

11943.281 Million cell updates/sec 

US-09-931-157-1 
4105 

1 gaattcgcggccgcctcttg taaaagtttacagaaacctt 4105 

IDENTITY_NUC 
Gapop 10.0 , Gapext 1.0 



5894648 



Searched: 2947324 seqs, 2269024515 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : Published_Applications_NA: * 

1 ; /cgn2_6/ptodata/2/pubpna/US07_PUBCOMB. seq: * 
2 : /cgn2_6/ptodata/2/pubpna/PCT_NEW_PUB. seq: * 
3: /cgn2_6/ptodata/2/pubpna/US06_NEW_PUB.seq:* 
4 : /cgn2_6/ptodata/2/pubpna/US06_PUBCOMB. seq: * 
5 : /cgn2_6/ptodata/2/pubpna/US07_NEW_PUB. seq: * 
6: /cgn2_6/ptodata/2/pubpna/PCTUS_PUBCOMB. seq:* 
7 : /cgn2_6/ptodata/2/pubpna/US08_NEW_PUB. seq: * 
8 : /cgn2_6/ptodata/2/pubpna/US08_PUBCOMB. seq: * 
9: /cgn2_6/ptodata/2/pubpna/US09A_PUBCOMB.seq:* 
10: /cgn2_6/ptodata/2/pubpna/US09B_PUBCOMB.seq:* 
11: /cgn2_6/ptodata/2/pubpna/US09C_PUBCOMB. seq:* 
12: /cgn2_6/ptodata/2/pubpna/US09_NEW_PUB.seq:* 
13 : /cgn2_6/ptodata/2/pubpna/US09_NEW_PUB. seq2 : * 
14 : /cgn2__6/ptodata/2/pubpna/US10A_PUBCOMB. seq: * 
15: /cgn2_6/ptodata/2/pubpna/US10B_PUBCOMB.seq:* 
16: /cgn2_6/ptodata/2/pubpna/US10C_PUBCOMB.seq:* 
17: /cgn2_6/ptodata/2/pubpna/US10_NEW_PUB.seq:* 
18: /cgn2_6/ptodata/2/pubpna/US60_NEW_PUB.seq:* 
19: /cgn2_6/ptodata/2/pubpna/US60_PUBCOMB.seq:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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3 


4105 


100. 


0 


4105 


15 


US-10-007-92 6A-229 
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4 


4105 


100. 


0 


4105 


15 


US- 10- 10 1-5 10-370 
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Sequence 
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Sequence 
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15 


US-10-101-510-59 


Sequence 


59, Appl 
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US-10-085-783A-41606 


Sequence 


41606, A 
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10. 
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468 
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US-10-242-535A-41606 


Sequence 


41606, A 


13 
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10. 
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10 


US-09-918-995-8960 


Sequence 


8960, Ap 
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395.8 


9. 


6 


1470 


16 


US-10-305-720-1203 


Sequence 


1203, Ap 


15 


395. 8 


9, 


6 


1632 


12 


US-10-311-671-28 


Sequence 


28, Appl 


16 


395.8 


9. 


6 
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13 


US-10-116-802-118 


Sequence 


118, App 


17 


395.8 


9. 


6 


4286 


10 


US-09-921-406C-13 


Sequence 


13, Appl 


18 


395. 8 


9. 


6 


4286 


15 


US-10-225-567A-113 


Sequence 


113, App 


19 


395.8 


9. 


6 


4286 


15 


US-10-007-926A-177 


Sequence 


177, App 


20 


395. 8 


9. 


6 


4286 


15 


US-10-210-120-15 


Sequence 


15, Appl 


21 


395.8 


9. 


6 


4286 


16 


US-10-372-683-48 


Sequence 


48, Appl 


22 


395.8 


9. 


6 


4301 


9 


US-09-931-157-2 


Sequence \ 


2, Appli 


23 


395. 8 


9. 


6 


4305 


13 


US-10-116-802-116 


Sequence 


116, App 


24 


392.6 


9. 


6 
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11 


US-09-826-509-496 


Sequence 


496, App 


25 
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9. 


4 


1892 


13 


US- 10- 116- 8 02-117 


Sequence 


117, App 


26 
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9. 


3 
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13 


US-10-235-192A-32 


Sequence 


32, Appl 


27 
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6. 


9 
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9 


US-09-867-701-3320 


Sequence ; 


3320, Ap 


28 
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3. 


8 
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15 


US-10-007-92 6A-228 


Sequence 


228, App 


29 
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3. 


6 
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9 


US-09-962-436-531 


Sequence \ 


531, App 


30 


147 


3. 


6 
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9 
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Sequence \ 
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31 
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3. 


6 
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9 
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Sequence ! 


917, App 


32 
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2. 


8 
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9 
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Sequence ; 


27, Appl 


33 
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2. 


5 


183337 


15 


US-10-020-141-5 


Sequence 


5, Appli 


34 
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2. 


4 
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10 


US-09-998-904-6 


Sequence 


6, Appli 


35 


91 


2, 


2 
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11 


US-09-82 6-509-510 


Sequence 


510, App 


36 


91 


2. 


2 


1726 


13 


US- 10-342-8 87-1136 


Sequence 


1136, Ap 


37 


91 


2. 


2 


1726 


13 


US-10-172- 118-1136 


Sequence 


1136, Ap 


38 


91 


2. 


2 


1726 


13 


US-10-388-578-9 


Sequence 


9, Appli 


39 


91 


2. 


,2 


1726 


15 


US-10-225-567A-129 


Sequence 


129, App 


40 


91 


2. 


.2 


1726 


16 


US-10-305-720-1215 


Sequence 


1215, Ap 


41 


79.6 


1. 


,9 


1200 


17 


US-10-221-384-1 


Sequence 


1, Appli 


42 


79.6 


1. 


,9 


1413 


15 


US-10-225-567A-57 


Sequence 


57, Appl 


43 


79.6 


1. 


.9 


1413 


16 


US-10-305-720-1275 


Sequence 


1275, Ap 


44 


78 


1, 


,9 


1200 


11 


US-09-826-509-458 


Sequence 


458, App 


45 


68,6 


1. 


,1 


1173 


11 


US-09-826-509-530 


Sequence 


530, App 



ALIGNMENTS 



RESULT 1 
US-09-931-157-1 

; Sequence 1, Application US/09931157 
; Patent No. US20020082414A1 
; GENERAL INFORMATION: 



APPLICANT: Imura, Hiroo 

APPLICANT: Nakao, Kazuwa 

APPLICANT: Nakanishi^ Shigetada 

TITLE OF INVENTION: Human Endotheiin Receptor 

FILE REFERENCE: 299002032411 

CURRENT APPLICATION NUMBER: US/ 09/ 931 , 157 

CURRENT FILING DATE: 2001-10-15 

PRIOR APPLICATION NUMBER: 08/121,446 

PRIOR FILING DATE: 1993-09-14 

PRIOR APPLICATION NUMBER: 07/911,684 

PRIOR FILING DATE: 1992-07-10 

PRIOR APPLICATION NUMBER: JP 3-172828 

PRIOR FILING DATE: 1991-07-12 

NUMBER OF SEQ ID NOS : 2 

S0FTW7VRE: FastSEQ for Windows Version 4.0 
SEQ ID NO 1 
LENGTH: 4105 
TYPE: DNA 

ORGANISM: Homo Sapiens 
FEATURE: 





N7\ME/KEY: 


CDS 






LOCATION: 


(485) . . . (1768) 






NAME/ KEY: 


sig peptide 






LOCATION: 


(485) . . . (544) 






NAME /KEY: 


mat peptide 






LOCATION: 


(545) . . , (1768) 




US- 


09-931-157- 


-1 




Query Match 


100.0%; Score 4105; DB 9; Length 4105; 




Best Local Similarity 100.0%; Pred. No. 0; 




Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 


0 


Qy 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 


Qy 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 




M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 


Qy 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 




Db 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 


Qy 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 


Qy 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 


Qy 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 


Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGATW^ 


420 



Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


/ion 


Ov 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAAT7\AGAGATATTTCCTCAAATTTGCCT 


480 




1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


421 


AA7y\AGT GAAGGT GT AAAAGCAGCAC7\AGT GCAAT AAGAGATATTTCCT CAAATTT GCCT 


/ion 
4 0 U 


Ov 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


481 


C7\AGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


54 (J 


Ov 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 


Ov 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 




1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 




Db 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 


Ov 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 




M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 


Ov 


721 


CAA?^TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 




Db 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 


Ov 
vy 


781 


AACTCTGCTCAGGATCATTTACCAGAACA7VATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 




Db 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


84 0 


Ov 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 


Ov 
vy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 




Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 


Ov 
vy 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 


Ov 

vy 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


1080 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


10 8 0 




1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1081 




1140 


Qy 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 


1200 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTG7\ATATAGGGGTGAACAGCAT7W\ACCTG 


1200 


Qy 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 



I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I 



Db 



1201 TATGCTCAATGCCACATCATyyVTTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 



Qy 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 


Qy 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 




Db 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 


Qy 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTT^TTTTTGCTCTTTGCTG 


1440 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 N 1 1 




Db 


1381 


GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 


Qy 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 


1500 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGAT^AACTGTGTATAACGAAATGGACAAGAA 


1500 


Qy 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 


Qy 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1620 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1561 


CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1620 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 


Qy 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAA7\ACAACCACAACACAGACCG 


1740 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 




Db 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1740 


Qy 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 




1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 


Qy 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 


1860 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1801 


7\ATCCTCTCGGAGAAAAAAATCAC7\AGGCAACTGTGACTCCGGG7^ATCTCTTCTCTGATC 


18 60 


Qy 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAG7\AATGCTTTCCAAAACCGCAAGGTAGA 


1920 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1920 


Qy 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 




AlAIIIIAIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIItlllltlltllllllllllll 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M M 




Db 


1921 


CT GGT T TAT C C AC C CACAAC AT CT AC GAAT C GT ACT T CT TTAAT T GAT CTAAT T T ACAT A 


198 0 


Qy 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 


Qy 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 


2100 






1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2041 


AAATGAAACCAGAAGGATATTTACTACTTTTGCATGATWVTAGAGCTTTCAAGTACATGG 


2100 



vY 


2101 


Db 


2101 




2161 


Db 


2161 


yy 






2221 


yy 


O i 




2281 




7 "^4 1 

^ O *i X 




2341 


yy 


74 01 

i *1 U X 


Db 


2401 


yy 


j£ M O X 


Db 


2461 


wy 


7 "^7 1 


Db 


2521 


Qy 


7 1 
Z O O X 


Db 


2581 


wy 


7 fi4 1 


Db 


2 641 


yy 


2701 


Db 


2701 


wy 


2761 


Db 


2761 


Qy 


2821 


Db 


2821 


Qy 


2881 


Db 


2881 



CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATATGGGCTCAGGTCACTTTTATTTGA7\ATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 80 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG7\7\AAAAAAAAGACAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGATWWVAAAAGACAAA 2340 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 252 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I 
TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 258 0 

I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 

ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAA7\AGTAATGC 258 0 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I i I I I I I I M 
TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAT^ATTTTGTATGA 2 64 0 

AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

I I I I I I I I I I I I I I I I I I I I II I I I II I I M M I I I I I I 

AA7\ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTT7^CTCTGCCTGAGACTT 27 00 

TCAGTGCACTGTATATAGAAGTCTAA7VACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

I I I II I I I I M I II I I I I I II I I I I I II II I II I I I I II I I I I I II I I I I I I I I I I II I I 

TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAG7WW\.GATCGAATTTTTCAG 2760 

ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 282 0 

II I I M I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2 820 

CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 80 

II I I II M I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

CACCTCCTATTCTCTTAATTTTTGTTAAAATGTT7\ACTGGCAGTAAGTCTTTTTTGATCA 288 0 

TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2 94 0 

I II M I M I I I I I I I M I I I I M I I I I 

TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 



Qy 


2941 


Db 


2941 


Qy 


3001 


Db 


3001 


Qy 


3061 


Db 


3061 


Qy 


3121 


Db 


3121 


Qy 


3181 


Db 


3181 


Qy 


3241 


Db 


3241 


Qy 


3301 


Db 


3301 


Qy 


3361 


Db 


3361 


Qy 


3421 


Db 


3421 


Qy 


3481 


Db 


3481 


Qy 


3541 


Db 


3541 


Qy 


3601 


Db 


3601 


Qy 


3661 


Db 


3661 


Qy 


3721 


Db 


3721 


Qy 


3781 



GAAAAATAATTACCCACATyVTGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I M I I I I I M I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I 

TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 312 0 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N 

GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

AA7\ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 
I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M 
ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 4 0 

GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I M I I I 

GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCA7y\GTGCATA 3300 

GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I M I I I I I 

GTCTGAGCTA7\AATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I M I I I M I I I I I I I 

TGTAGCAACCTTCTGCATTCATATUVTCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I M I I I I I I M I I 

AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 348 0 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I M I I I I I 

TGGTTTGATT^GCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I 
ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I INI I I I I I I I I I I I 

CAAGGCTAAG7UVGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 



Db 


3781 




3841 


Db 


3841 


n\7 
wy 


3901 


Db 


3901 


yy 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



I I I I I I I I I I I I I I I I M M I I I I I M I I I I I M I I I I I I I M I I I I I I I I M I I I I I I I 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I 
ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I > I 

ATTCAGTUUVGTCATAGATTTCTGT^GGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

T7\ACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 020 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 408 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATT^GTG 4 08 0 

TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I I I I I M 
TAAAATAAAAGTTTACAGTWVCCTT 4105 



RESULT 2 

US-10-225-567A-115 

Sequence 115, Application US/10225567A 
Publication No. US20030113798A1 
GENERAL INFORMATION: 
APPLICANT: LifeSpan Biosciences 
APPLICT^T: Brown, Joseph P. 
APPLICANT: Burmer, Glenna C. 
APPLIC7\NT: Roush, Christine L. 

TITLE OF INVENTION: ANTIGENIC PEPTIDES AND ANTIBODIES FOR G PROTEIN-COUPLED 
RECEPTORS (GPCRS) 

FILE REFERENCE: 1920-4-4 

CURRENT APPLICATION NUMBER: US/ 10/225 , 567A 
CURRENT FILING DATE; 2001-12-19 
PRIOR APPLICATION NUMBER: 60/257,144 
PRIOR FILING DATE: 2000-12-19 
NUMBER OF SEQ ID NOS : 2292 
S0FTW7VRE: Patentin version 3.1 
SEQ ID NO 115 
LENGTH: 4105 
TYPE: DNA 

0RG7VNISM; Homo sapiens 
US-10-225-567A-115 

Query Match 100.0%; Score 4105; DB 15; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 
Qy 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I 

Db 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 



Qy 61 AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 



Db 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGACjCLUI 


1 9n 

±z u 


Ov 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


121 


CGC GC GC GC GT ACAGT CAT C C CG CTGGT CT GAG GAT T GT GGAGAGG C GGT GG AGAG G CTT 


1 ft n 


Ov 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


CAT C CAT C C C AC C C G GT CGT C GC C GGGGAT T GGGGT C C CAGC GACAC CT C CCC GGGAGAA 




Ov 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 


Ov 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


o iz r\ 


Ov 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 


Db 


361 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 

TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


/ion 


Ov 


421 


TUW^GTGAAGGTGTAAT^AGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 




M 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 i 




Db 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


4 oU 


Ov 
wy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


481 


CT^GATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


54 0 


Ov 
vy 


541 


CAGT GATAAT CCT GAGAGAT ACAGCACAAAT CTAAGCAAT CAT GTGGAT GATTT CACCAC 


600 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


n n 


Ov 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCTVACCCACTAATTTGGTCCT 


660 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


bbU 


Ov 
vy 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAT^TTACTTCAGCTTT 


720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


AC C CAGCAAT GGCT CAAT GCACAACT ATT G C C CAC AGC AGACT AAAAT T ACT TCAGCT T T 


ion 
/z U 


Ov 
Sdy 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 


780 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


721 


CAAAT AC AT T AACACT GT GAT AT CTT GT ACT AT T T T CAT C GT GG GAAT G GT G GGGAAT GC 


Ton 
/ o U 


Qv 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


/ O 1 




840 


Qy 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATC7UVTGTATT 


900 


Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 



I M I I I I I I I I I I I I I I I I I I I I I I I I I M M M I I I I I I I I M I I I I I I M I I I I I I M 



Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 


Qy 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCi 


1 n o n 




1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 


Qy 


1021 


TAGT GT T GAC AGGT ACAGAGC AGT T GCCT C CT GGAGT C GT GT T C AGG GAAT T G G GAT T C C 


1 n fi n 
± U 0 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 M 




Db 


1021 


TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGG7UVTTGGGATTCC 


1080 


Qy 


1081 


T T T GGT AACT GC C AT T GAAAT T GT CT C C AT CT GGAT C CT GT C CT T TAT CCT G GC C AT T CC 


1 T / n 
114 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 


Qy 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 


1200 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


TGAAGCGATTGGCTTCGTCATGGTACCCTTTG7\ATATAGGGGTGAACAGCATAAAACCTG 


1200 


Qy 


1201 


TATGCTC7VATGCCACATC7VAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1201 


TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 


1260 


Qy 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


•1 o o n 

132 U 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


1261 


CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 


1320 


Qy 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGTU^TTGCCCTCAGTGAACATCTTAA 


138 0 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 


1380 


Qy 


1381 


GCAGCGTCGAGAAGTGGCTWWVCAGTTTTCTGCTTGGTTGTTKATTTTTGCTCTTTGCTG 


1440 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


GCAGCGTCGAGAAGTGGCT^JWVACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 


1440 


Qy 


1441 


GTTCCCTCTTCACTTAAGCCGTATATTGAAGTWyVCTGTGTATAACGAAATGGACAAGTVA 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


1441 


GTTCCCTCTTCACTT7\AGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 


1500 


Qy 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 


1560 




1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1501 


CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTTU^CTTGGCTUVC 


1560 


Qy 


1561 


CAT GAAT T CAT GT AT7WVC CC C AT AGCT CT GT AT T T T GT GAG CAAGAAATT TAAAAAT T G 




Db 


1561 


1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 


1620 


Qy 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


loo U 




1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 




Db 


1621 


TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 


1680 


Qy 


1681 


CAT GAAC GGAACAAGCAT C C AGT GGAAGAAC CAC GAT C7\AAACAAC C ACAAC AC AGAC C G 


1 / fi u 




, , 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M M 1 1 1 M 1 1 M M M M M M 1 




Db 


1681 


CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 


1740 


Qy 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 




1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 





1801 


Db 


1801 


yy 


1861 


Db 


1861 




1921 


Db 


1921 


yy 


X -7 y J. 


Db 


1981 


s^y 


^1 1 X 


Db 


2041 


s^y 


2101 


Db 


2101 


yy 


^ X U X 


Db 


2161 


r\\7 


^ ^ X 


Db 


2221 


yy 


^ ^1 O X 


Db 


2281 


yy 


2341 


Db 


2341 


yy 


2401 


Db 


2401 


Ov 


2461 


Db 


2461 


Qy 


2521 


Db 


2521 


Qy 


2581 


Db 


2581 



AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGG7\ATCTCTTCTCTGATC 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I 

AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 1860 

CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I 

CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTTVATTGATCTAATTTACATA 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTCTGCGTGTTGTATTCAGCACT7VAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 204 0 

AAATGATUVCCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I 

CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

AGATTAACGACAAGATTTTCTACTTTTTTT7\AGTGATTTTTTGTCCTTCAGCCAAACACA 2220 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I 
AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 8 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 228 0 

TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGT^AAAAAAAAAGACAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

TAATAGCCTAACATGATTATTTG7\ACTTATTTACACATAGTTTGAAAAA7W\AAGACAAA 2340 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I 

AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTA7\A 24 00 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 2460 

TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTTGGCAGTTTAATAGATGTTACTCAAAG7VATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I M I I I I I I I I I I I I 

ATGGTGTTTTATTAC7\AGGGACCTTGAACATGTTTTGTATGTT7WVTTCAAAAGTAATGC 2580 

TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I M I I I I I I I I I I I I I I I I I I I 
TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 2640 



Qy 


2641 


AAAAT CAATGT CAAGT AC CAAAAT GTT7VA.T GT AT GT GT CAT T T AACT CT GC CT GAGACTT 


O "7 n r» 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2641 


AAAATCAATGTCAAGTACCAA7\ATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 


2700 


Qy 


2701 


TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 


Z / bU 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


2701 


TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 


2760 


Qy 


2761 


ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 


282 0 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2761 


ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 


2820 


Qy 


2821 


CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 


28 8 0 




1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 




Db 


2821 


CACCTCCTATTCTCTT7\ATTTTTGTTAAAATGTTAACTGGCAGT7^AGTCTTTTTTGATCA 


2880 


Qy 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 


2940 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2881 


TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 


2940 


Qy 


2941 


GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 


3000 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2941 


GAAAAATAATTACCCACAAATGCCACCAGTTiACTTAACGATTCTTCACTTCTTGGGGTTT 


3000 


Qy 


3001 


TCAGTATGT^CCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 


3060 






1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3001 


TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 


3060 


Qy 


3061 


GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 


3120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3061 


GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 


3120 


Qy 


3121 


AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 


3180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


3121 


AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTA7VATTTCTTTTAGCCC 


3180 


Qy 


3181 


ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 


3240 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 




Db 


3181 


ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 


3240 


Qy 


3241 


GGTATGTATGGATTT7\ATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 


3300 






1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 




Db 


3241 


GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 


3300 


Qy 


3301 


GT CT GAGCTAAAAT CT AGGT GAT T GT T CAT CAT GACAAC CT GC C T C AGT C CAT TT TAAC C 


33 60 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3301 


GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 


3360 


Qy 


3361 


T GT AG CAAC CT T CT GC AT T C ATAAAT CTT GT AAT CAT GT T AC CAT T ACAAAT GGGAT AT A 


342 0 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3361 


TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 


3420 


Qy 


3421 


AGAGGCAGCGTGA7\AGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 


3480 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


3421 


AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 


3480 


Qy 


3481 


TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCA7WVGTCATTA 


3540 



Db 


3481 


vy 


O O *i J. 


Db 


3541 


Pitt 


O D U J. 


Uk) 


O U U X 




O D D J. 




3661 


Qy 


7 9 1 


nb 


3721 


Qy 


"5 "7 P 1 




3781 


Qy 


o O ^ JL 


JJJLJ 


J O T X 


Qy 






O 27 U X 


Qy 


v5 -7 D X 


UJL) 


o _/ u X 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



IN I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAT^GTCATTA 3540 

CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I 
CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I M 

ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 8 0 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M M M I I I 
CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

ATTCAG7\7iJ\GTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I M I I I I I M 

ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 

I M I I I I I I I I I I I I I I M I I I I I I I I M I I M I I I N I I I I I I I I I I I I I M I I I I i I I 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 



I I I I I M M I I I I I I I I I I I I I I 



RESULT 3 

US-10-007~926A-229 

Sequence 229, Application US/10007926A 
Publication No. US20030143539A1 
GENERAL INFORMATION: 
APPLICANT: BERTUCCI, FRANCOIS 
APPLICTVNT: HOULGATTE, REMI 
APPLICANT : BIRNBAUM, DANIEL 
APPLICANT: NGUYEN, CATHERINE 
APPLICANT: VIENS, PATRICE 
APPLICANT: FERT, VINCENT 

TITLE OF INVENTION: GENE EXPRESSION PROFILING OF PRIMARY BREAST CARCINOMAS 
TITLE OF INVENTION: USING ARRAYS OF CANDIDATE GENES 



; FILE REFERENCE: 1546-R-OO 

; CURRENT APPLICATION NUMBER: US/10/ 007 , 92 6A 

; CURRENT FILING DATE: 2001-12-07 

; PRIOR APPLICATION NUMBER: 60/254,090 

; PRIOR FILING DATE: 2000-12-08 

; NUMBER OF SEQ ID NOS : 4 68 

; SOFTWARE: PatentlnVer. 2.1 

; SEQ ID NO 229 

; LENGTH: 4105 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE : 

; OTHER INFORMATION: endothelin receptor type a (EDNRA) gene. 
US-10-007-92 6A-22 9 



Query Match 100.0%; Score 4105; DB 15; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




UJJ 




GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 


Qy 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 






61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 


Qy 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 


Qy 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


Z 4 U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M M 1 1 




Db 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 


Qy 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCG7\AGCCGCCGCCGCGC 


300 




1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 


Qy 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 


Db 


301 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 

CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 


Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 


Qy 


421 


AAAAAGTG7\AGGTGTAAAAGCAGCACAAGTGC7\ATAAGAGATATTTCCTCAAATTTGCCT 


480 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


AAAAAGTGAAGGTGTAATU^lGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 


Qy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 






1 1 1 1 1 1 1 1 M M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 




Db 


481 


CAAGATGG7WVCCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 


Qy 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 



I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I i I I I I I I 



Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 


Db 


841 


Qy 


901 


Db 


901 


Qy 


961 


Db 


961 


Qy 


1021 


Db 


1021 


Qy 


1081 


Db 


1081 


Qy 


1141 


Db 


1141 


Qy 


1201 


Db 


1201 


Qy 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 



CAGTGATAATCCTGAGAGATACAGCACATU^TCTAAGCAATCATGTGGATGATTTCACCAC 600 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAA7\ATTACTTCAGCTTT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M M I I I I I I I I I I I I I I 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGT^TGGTGGGGAATGC 7 80 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I M I I M I I I I M I 

AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGC7\A 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGC7\A 960 

GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGTVATTGGGATTCC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

TTTGGTAACTGCCATTGA7\ATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 114 0 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I t I I I M I I I I I I I I M I M I I I I I I I I 

TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

TGAAGCGATTGGCTTCGTCATGGTACCCTTTGT^TATAGGGGTGAACAGCATAAAACCTG 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATA7\AACCTG 1200 

TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I 
TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I M I I I I I I I I I I I I I I I I 

CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

TTGTGAGATGTTGAACAGAAGGj^ATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

M I I I I I I I I M I I I I I I I M I I I I M I M M I I I I M N I I I I I I I I I I I I I I I I I I I I 

TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I M I I I I I M I M I 

GCAGCGTCGAGAAGTGGCAAAj^ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 



Qy 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGAC7\AGAA 1500 

I I M I I I I I I I I I I I I I I M I I I I I I M I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAATUVCTGTGTATAACGAAATGGACAAGAA 1500 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I II I I II I I I II I II M M I I I I II I I II I II I II I I I I I II I I II I I I I I I II I I I M 
Db 1501 CCGATGTGTVATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1620 

I I I I I I II I I I II I I I II II I I I II II I I I I II I I I I I I II II I I I I I I II II I I I I I II 

Db 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTG 1620 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 168 0 

II I I I I II I II I I I I I I I II I I I I II I I II I I I II II I II I II II I I I II I I I I I I II II 

Db 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 168 0 

Qy 1681 CATGAACGGAAC7\AGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 17 4 0 

I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GAGCAGCCATAAGGACAGCATGTyVCTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 1800 

Qy 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAA7\ACCGC7UVGGTAGA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAA7UVCCGCAAGGTAGA 1920 

Qy 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 19 8 0 

I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I 
Db 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTT7\ATTGATCTAATTTACATA 198 0 

Qy 1981 TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAG7\ATGAAGACTGTT 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 204 0 

Qy 2 041 A7^TG7\AACCAGAAGGATATTTACTACTTTTGCATGA7^TAGAGCTTTCAAGTACATGG 2100 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

Qy 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGT^CTGGTCACCATGTWVCTTTAG 2160 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

Qy 2161 AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 2161 AGATTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

Qy 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 228 0 

I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 8 0 



Qy 2281 TAATAGCCTAACATGATTATTTGTU^CTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 2340 

Qy 2341 TyVTAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 2400 

Qy 2401 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

Qy 2461 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 2520 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 2461 TTTGGCAGTTTAATAGATGTTACTC7\AAGAATTTTTT7VAGAACTGTATTTTATTTTTTAA 2520 

Qy 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTC7\AAAGTAATGC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

Qy 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGT7\AATTTTGTATGA 264 0 

Qy 2 641 AAAATCAATGTCAAGTACC7U\AATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 2 641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

Qy 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCG7VATTTTTCAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 27 01 TCAGTGCACTGTATATAG7\AGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 2760 

Qy 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2 820 

Qy 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2 880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 2821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2 880 

Qy 2 881 TTCCCTTTTCCATATAGGAAACATT^TTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2 940 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

Qy 2 941 GAAAAATiQATTACCCACTWVTGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I I I l-l I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 GA7VAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 312 0 

Qy 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 3180 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGT7\AATTTCTTTTAGCCC 3180 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I 
Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 

Qy 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 33 00 

Qy 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTTyVCC 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTTVATCATGTTACCATTACAAATGGGATATA 3420 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 3421 AGAGGCAGCGTGA7\AGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

Qy 34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I 

Db 34 81 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCA7\AAGTCATTA 3540 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCTUVTTCAATGTGGTGATGAAATTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAAT7y\ATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTT^GATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAAT7\ACATCAGGTTCCAGTTGCTTG7\ATTG 3720 

I I I I I I I I I I I I I I i i I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I 

Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAATUVTAACATCAGGTTCCAGTTGCTTGAATTG 3720 

Qy 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

Qy 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 4 0 

Qy 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAA 3900 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATi^A 3900 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 



Qy 



3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I M I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I M I 



Db 



3961 TAACTGTGGTTTACTAGCAGGAATATTTCC7VATTTCTACCTTTACTACATCTTTTCAACA 4020 



Qy 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 408 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I N 

Db 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 408 0 

Qy 4081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I M I I I I I I I I I I I I I I I I I I I I I I 
Db 4 081 TAA7\ATAAAAGTTTACAGAAACCTT 4105 
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Query Match 100.0%; Score 4105; DB 15; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 






1 1 M M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 




Db 


1 


GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 


60 


Qy 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 


120 


Qy 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 




Db 


121 


CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 


180 


Qy 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 M 




Db 


181 


CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 


240 


Qy 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 






1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 


300 


Qy 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 







1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 M 1 1 




Db 


301 


CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 


360 


Qy 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


/ion 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 N 




Db 


361 


TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 


420 


Qy 


421 


AAAAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


4 o U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


TW^AAAGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCT 


480 


Qy 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 




1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 




Db 


481 


CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 


540 


Qy 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 


600 


Qy 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 




Db 


601 


TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 


660 


Qy 


661 


ACCCAGCAATGGCTCT^TGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 


ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 


720 


Qy 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGG7\ATGC 


780 






1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


721 


CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGG7\ATGGTGGGGAATGC 


780 


Qy 


781 


AACTCTGCTCAGGATCATTTACCAG7\ACAAATGTATGAGGAATGGCCCC7\ACGCGCTGAT 


840 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 


840 


Qy 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 




M 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 




Db 


841 


AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 


900 


Qy 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 


960 






1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


901 


TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGC7\A 


960 


Qy 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 




Db 


961 


GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 


1020 


Qy 


1021 


T AGT GT T GAG AGGT AC AGAG C AGT T GO CT C CT GGAGT CGT GT T CAGG GAAT T G GGATT CO 


1 rv o n 
lUoU 


Db 


1021 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 


1080 


Qy 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1081 


TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 


1140 



Qy 1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 12 00 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 



Db 



1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTG 1200 



Qy 1201 TATGCTCAATGCCACATCATWVTTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I 

Db 1201 TATGCTCAATGCCACATC7UWVTTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 1260 

Qy 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

Qy 1321 TTGTGAGATGTTGAACAGAAGGT^TGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 138 0 

I I I I M I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I M I I I I I I I I I I I 

Db 1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

Qy 1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 14 4 0 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I M I I I I I I I M I I I I 
Db 1381 GCAGCGTCGAGAAGTGGCAAATUVCAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 144 0 

Qy 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTAT7VACGAAATGGACAAGAA 1500 

I I I I I I I I I I I I I I I I I I I I I M I I M I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGTWVTGGACAAGAA 1500 

Qy 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I 
Db 1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

Qy 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGA7\ATTTAAAAATTG 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTATWVATTG 1620 

Qy 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCC7VA7UVGTCTGATGACCTCGGTCCC 168 0 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

Qy 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 174 0 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CATGAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

Qy 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 1741 GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 18 00 

Qy 1801 7\ATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M M I I I I I I I I I I I I M I I I 

Db 18 01 AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATC 18 60 

Qy 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 1920 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 192 0 

Qy 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I M I I I I I I I I I I 
Db 1921 CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 1980 

Qy 1981 TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1981 TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 2040 



Qy 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

I I I M I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 2041 AAATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 2100 

Qy 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2101 CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAG 2160 

Qy 2161 AGATTAACGACAAGATTTTCTACTTTTTTT7\AGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

I I I I I I I I M I I I M I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGATT7\ACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACA 2220 

Qy 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTT7\ACTGCA 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 22 80 

Qy 22 81 T7\ATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG7y\AA7WVAAAGACAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACA7VA 2340 

Qy 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 24 00 

Qy 2401 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 01 ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 24 60 

Qy 24 61 TTTGGCAGTTT7\ATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I M I I I 
Db 24 61 TTTGGCAGTTTAATAGATGTTACTCAAAGAATTTTTTT^GAACTGTATTTTATTTTTTAA 252 0 

Qy 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 2580 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGC 258 0 

Qy 25 81 TTCJ\ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I 
Db 2581 TTCAATCAGATAGTTCTTTTTCACAAGTTC/yVTACTGTTTTTCATGTAAATTTTGTATGA 264 0 

Qy 2641 TVAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 27 00 

I I I I I I I M I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M 
Db 2641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

Qy 27 01 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAG 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I 

Db 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAA7WVGATCGAATTTTTCAG 2760 

Qy 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 27 61 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

Qy 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 28 80 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTT^GTCTTTTTTGATCA 2880 



Qy 2 881 TTCCCTTTTCCATATAGGAAACATAATTTTGAA.GTGGCCAGATGAGTTTATCATGTCAGT 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I M I M I I I I I I 11 I I I I I I I I I 
Db 2881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2 940 

Qy 2 941 GA7W\ATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 2941 GAAAAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 3120 

Qy 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

Qy 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 GGTATGTATGGATTTAATCTAATCT7\ATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

Qy 3301 GTCTGAGCT7\AAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I I j I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M M I 
Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 8 0 

Qy 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 354 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTA 3540 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I 

Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGT7\AAATAACATCAGGTTCCAGTTGCTTGAATTG 372 0 



Qy 



3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 



Db 


3721 


Ov 


3781 


Db 


3781 


Ov 


3841 


Db 


3841 


Ov 


3901 


Db 


3901 


Ov 


3961 


Db 


3961 


Qy 


4021 


Db 


4021 


Qy 


4081 


Db 


4081 



M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 3780 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 384 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 3840 

ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTAT7\A 3900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



ATTCAGAT^GTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 
I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4 02 0 

AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I [ I I I I M I I I I I I I I M I 
AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 08 0 

TAAAATAAAAGTTTACAGTWVCCTT 4105 

M I I I I I I I I I I I I I I I I I I I I M I 

TAAAATAAAAGTTTACAGAAACCTT 4105 
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; PRIOR APPLICATION NUMBER: US 10/271,690 
; PRIOR FILING DATE: 2002-10-16 

PRIOR APPLICATION NUMBER: US 60/344,534 
; PRIOR FILING DATE: 2001-10-18 
; NUMBER OF SEQ ID NOS : 49 
; SEQ ID NO 46 
LENGTH: 4105 
TYPE: DNA 

ORGANISM: Homo sapien 
US-10-372-683-46 

Query Match 100,0%; Score 4105; DB 16; Length 4105; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4105; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 GAATTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 



Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy. 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 


Qy 


541 


Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 


Db 


841 



1 GT^TTCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGG 60 

AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

AGACGGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCT 12 0 

CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I 

CGCGCGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTT 18 0 

CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M M I I I I M I I I I 

CATCCATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAA 24 0 

GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

GCAGTGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGC 300 

CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I 

CGGAGCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTC 360 

TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAA7UV 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I M 

TGGCCCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAA 42 0 

AAAAAGTGAAGGTGTA7W\GCAGCACAAGTGCAATAAGAGATATTTCCTCA7U\TTTGCCT 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I 

AAAAAGTGAAGGTGTAAAAGCAGCAC7\AGTGCAATAAGAGATATTTCCTCAAATTTGCCT 480 

CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I M I M I N 

CAAGATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAAT 54 0 

CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 
I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
CAGTGATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCAC 600 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCT 660 

I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M 

TTTTCGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATC7VACCCACTAATTTGGTCCT 660 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

ACCCAGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTT 720 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

CAAATACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGC 780 

AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 840 

I I I I I I I M I M I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I 

AACTCTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGAT 84 0 

AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I 
AGCCAGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATT 900 



901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 TAAGCTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAA 960 

961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 1020 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 GCTGTTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCT 102 0 

1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 TAGTGTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCC 1080 

1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 TTTGGTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCC 1140 

1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAT^AACCTG 1200 

I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 TGAAGCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATATWVCCTG 1200 

12 01 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

12 01 TATGCTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCT 12 60 

1261 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

12 61 CTTCGGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGAC 132 0 

1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

1321 TTGTGAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAA 1380 

1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 GCAGCGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTG 1440 

1441 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
14 41 GTTCCCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAA 1500 

1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAAC 1560 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
1501 CCGATGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATT7\ACTTGGCAAC 1560 

1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTA7WVATTG 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 CATGAATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGC7VAGAAATTTAAAAATTG 1620 

1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1621 TTTCCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCC 1680 

1681 CATGAACGGAACT^AGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCG 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
1681 CATGAACGGAACAAGCATCCAGTGG7\AGAACCACGATCAAAACAACCACAACACAGACCG 17 40 



Qy 


1741 


GAGC AGC C AT AAGGACAG CAT GAACT GAL- L AL C C i 1 AGAAG CACT C CT C GG i AU 1 U L, i 


1 ft nn 

X o u u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 




Db 


1741 


GAGCAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCAT 


1800 


Qy 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAAC 1 G 1 GAC i CLGGGAAi ClCilL-iUi LrAi u 


1 fi f^n 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 




Db 


1801 


AATCCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGG/yVTCTCTTCTCTGATC 


1860 


Qy 


1861 


m r-i-i r-r-» m < m m Ti T\ m m TV m T\ TV TV TV TV 7\ TV TV 7\ rri rnm m TV TV TV TV /~* TV "A rp TV 7\ 

CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAAiGui i 1 CCAAAAUUGLAACjiai 


1 Q9 n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1861 


CTTCTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGA 


1920 


Qy 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAAl i 1 AuAiA 


1 Q ft n 
X y o u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1921 


CTGGTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATA 


1980 


Qy 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACi Gl i 


o n /I n 
Z U U 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1981 


TTCTGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTT 


2040 


Qy 


2041 


AAAT GAAAC CAGAAGGAT ATT TACT ACT T T T GCAT GAAAAT AGAGCT T TCAAGT AC AT GG 


z 1 U U 




M 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


2041 


AT^ATGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGG 


2100 


Qy 


2101 


CT AGCT T T TAT GGCAGT T CT GGT GAAT GT T CAAT GG GAACT GGT CAC CAT GAAACT T TAG 


o 1 ^ n 
Z 1 bu 




M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2101 


CTAGCTTTTATGGCAGTTCTGGTGAATGTTCAATGGG7\ACTGGTCACCATGAAACTTTAG 


2160 


Qy 


2161 


AGATTAAC GACAAG ATT T T CT ACT T TTT T T AAGT GAT TTTTTGTCCTT CAGC CAAAC ACA 


noon 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M M 1 1 1 1 




Db 


2161 


AGATTAACGACAAGATTTTCTACTTTTTTT7\AGTGATTTTTTGTCCTTCAGCCAAACACA 


2220 


Qy 


2221 


AT AT GGGCT C AGGT C ACT T T T AT T T GAAAT GTC AT T T GGT G C C AGT ATTT TT T AACT GC A 


o o Q n 
ZZ 0 u 




1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2221 


ATATGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCA 


2280 


Qy 


2281 


TAATAGCCTAACAT GATT ATTTGAACTT ATTTACACAT AGTTT GAAAAAAAAAAGACAAA 


Q "5 A n 
Z o ^ u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2281 


TAATAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAA 


2340 


Qy 


2341 


^ _ mrt^ -ifc m ^-^ -n n -n mm Ti tv mm T\ m T\ mm mm TV m TV m TV m m rn TV rn rn rn rp rn rri rn "A TV TV 

AATAGTATTCAGGTGAGCT^TTAGATTAGTATTTTCCACGTCACTAi 1 iAi 1 i 1 i i iAAA 


Z fi u u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


2341 


AATAGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAA 


2400 


Qy 


2401 


^ r-i-i m TV -ft #*^m Ti TV TV TV TV TV m TV /~^m TV T\ rp m TV TV TV TV 7V rp rp /** TV rp tv TV TV 

ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGi CI GAl CjAUACA 


OA f^n 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 




Db 


2401 


ACACAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACA 


2460 


Qy 


2461 


TTTGGCAGTTTAATAGATGTTACrCAAAGAAi i i i i I AAGAACi tji Al i i iAi i i i i iaa 


p S9 n 

i. o ^ u 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M M 




Db 


2461 


TTTGGCAGTTT7UVTAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAA 


2520 


Qy 


2521 


ATGGTGTTTTATTACT^GGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTT^ATGC 


2580 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2521 


ATGGTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCATVAAGTAATGC 


2580 


Qy 


2581 


TTCAATCAGATAGTTCTTTTTCACAAGTTCTyVTACTGTTTTTCATGTAAATTTTGTATGA 


2640 



Db 2581 TTCT^ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGA 264 0 

Qy 2641 AAAATC7\ATGTCAAGTACCAAAATGTT7\ATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 2641 AAAATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTT 2700 

Qy 2701 TCAGTGCACTGTATATAGAAGTCTAAAACACACCT7\AGAGAA7VAAGATCGAATTTTTCAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 TCAGTGCACTGTATATAGAAGTCT7W\ACACACCTAAGAGAAAAAGATCGAATTTTTCAG 2760 

Qy 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2761 ATGATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATAT 282 0 

Qy 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTT7\ACTGGCAGTAAGTCTTTTTTGATCA 28 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 2 821 CACCTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCA 2 8 8 0 

Qy 2881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 2940 

I I I I I M I I I I I I M I I I I I M I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 2881 TTCCCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGT 294 0 

Qy 2 941 GAAAAATAATTACCCACA7\ATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 GAAAAATAATTACCCACTW^TGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTT 3000 

Qy 3001 TCAGTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M M I I I I 

Db 3001 TCAGTATGAACCT7\ACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAG 3060 

Qy 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 312 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 GGCCCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAG 312 0 

Qy 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 3121 AAAATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCC 318 0 

Qy 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 324 0 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I 
Db 3181 ATTTTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGAT 32 4 0 

Qy 3241 GGTATGTATGGATTTAATCTAATCT7\ATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 3241 GGTATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATA 3300 

Qy 3301 GTCTGAGCTAAT^ATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M 

Db 3301 GTCTGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACC 3360 

Qy 3361 TGTAGCAACCTTCTGCATTCATA7UVTCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I M I I I I I I I I I I 
Db 3361 TGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATA 3420 

Qy 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I M I I I I I I I I 



Db 3421 AGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGT 34 80 

Qy 34 81 TGGTTTGAT7\7^GCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCA7U\AGTCATTA 3540 

I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 3481 TGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCT^AAAGTCATTA 3540 

Qy 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I M 
Db 3541 CACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGT 3600 

Qy 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I 

Db 3601 TGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATA 3660 

Qy 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 3661 ATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTG 3720 

Qy 3721 CAAGGCTAAG7\AGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3721 CAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCG 37 8 0 

Qy 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I 11 I I I I 
Db 37 81 CATCATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAG 38 40 

Qy 3841 AC7\ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAA7W\AATGCATTTTATAA 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 3841 ACAATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTAT7\A 3900 

Qy 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I i M 

Db 3901 ATTCAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAG 3960 

Qy 3961 TAACTGTGGTTTACTAGCAGG7\ATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 3961 TAACTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACA 4020 

Qy 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 021 AGTAACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTG 4 080 

Qy 4 081 TAAAATAAAAGTTTACAGAAACCTT 4105 

I I I I I I I I I I I I I I I I I I I M I I I I 

Db 4 081 TAAAATAAAAGTTTACAGA7UVCCTT 4105 



RESULT 6 

US-10-305-720-1257 

; Sequence 1257, Application US/10305720 
; Publication No. US2004 0010136A1 
; GENERAL INFORMATION: 

; APPLICANT: Au-Young, Janice K. ; Seilhamer, Jeffrey J. 

; TITLE OF INVENTION: Composition for the Detection of Signaling Pathway Gene 
Expression 

; FILE REFERENCE: PA- 0002-1 CON 

; CURRENT APPLICATION NUMBER: US/ 10/305 , 72 0 



CURRENT FILING DATE: 2002-11-26 
PRIOR APPLICATION NUMBER: 09/016,434 
PRIOR FILING DATE: 1998-01-30 
NUMBER OF SEQ ID NOS : 1490 
SOFTWARE: PERL Program 
SEQ ID NO 1257 
LENGTH: 4079 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc_feature 

OTHER INFORMATION: GenBank ID No. US2 004 0010136A1 g219649 
US-10-305-720-1257 

Query Match 99.4%; Score 4079; DB 16; Length 4079; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4079; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 5 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 1 TCGCGGCCGCCTCTTGCGGTCCCAGAGTGGAGTGGAAGGTCTGGAGCTTTGGGAGGAGAC 60 

Qy 65 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 12 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 61 GGGGAGGACAGACTGGAGGCGTGTTCCTCCGGAGTTTTCTTTTTCGTGCGAGCCCTCGCG 12 0 

Qy 125 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 18 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGCGTACAGTCATCCCGCTGGTCTGACGATTGTGGAGAGGCGGTGGAGAGGCTTCATC 18 0 

Qy 185 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAG7VAGCAG 24 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CATCCCACCCGGTCGTCGCCGGGGATTGGGGTCCCAGCGACACCTCCCCGGGAGAAGCAG 240 

Qy 245 TGCCCAGGAAGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 304 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 241 TGCCCAGG7UVGTTTTCTGAAGCCGGGGAAGCTGTGCAGCCGAAGCCGCCGCCGCGCCGGA 300 

Qy 305 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 364 

I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 GCCCGGGACACCGGCCACCCTCCGCGCCACCCACCCTCGCTTTCTCCGGCTTCCTCTGGC 360 

Qy 365 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTGAAAAAAAA 424 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I M I I I I I I I I I 

Db 361 CCAGGCGCCGCGCGGACCCGGCAGCTGTCTGCGCACGCCGAGCTCCACGGTG7WVAAAAA 42 0 

Qy 425 AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 484 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I M M I I I I 
Db 421 AGTGAAGGTGTAAAAGCAGCACAAGTGCAATAAGAGATATTTCCTCAAATTTGCCTCAAG 48 0 

Qy 485 ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATGG7\AACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 54 0 



Qy 

Db 



545 GATAATCCTGAGAGATACAGCACAAATCTT^AGCAATCATGTGGATGATTTCACCACTTTT 604 

I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I 
541 GATAATCCTGAGAGATACAGCACAAATCTAAGCAATCATGTGGATGATTTCACCACTTTT 600 



Qy 


605 


CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 


664 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


601 


C GT GGC AC AGAGCT CAGCTT C CT G GTT AC C ACT CAT CAAC CC AC T AATT T GGT C C i AC u O 


D D U 


Qy 


665 


AGC7U^TGGCTCAATGCACAACTATTGCCCACAGCAGACT7\AAATTACTTCAGCTTTCAAA 


724 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


661 


AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAAl iACTTCAGCi J. lL.Pd\K 


T? n 
/ z u 


Qv 


725 


TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGG7VATGGTGGGGAATGCAACT 


784 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ill 




Db 


721 


TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAAl GGIGGGGAAJ. GCAAC 1 


"7 p n 
/ o u 


Ov 


785 


CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 


844 




1 1 1 M 1 II 1 II 1 1 1 II II 1 II 1 1 II II 1 1 M 1 1 1 1 1 II 1 1 1 11 1 II 1 1 1 1 1 M 1 1 1 1 II 1 




Db 


781 


CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 


840 


Ov 


845 


AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 


904 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


841 


AGT CTTGCCCTT GGAGAC CTT AT CT AT GT GGT CAT T GAT CT CCCT AT C7\AT GT AT TTAAG 


Q n r\ 
y UU 


Ov 


905 


CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 


964 


Db 


901 


1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 


Q n 
y bU 


Ov 


965 


TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 


1024 




1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


961 


TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 


T n o n 


Ov 


1025 


GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 


1084 




1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1021 


GT T GACAGGT ACAGAGCAGT TGCCTCCTG GAGT C GT GTT CAGGGAAT T GGGAT T C CT T T G 


1 n p fi 
1 u o u 


Ov 


1085 


GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 


1144 




1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1081 


GT AACT GC C AT T GAAAT T GT CT C C AT CT GGAT C CT GT CCT T T AT C CT GGCC ATT C CT GAA 




Qy 


1145 


GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 


1204 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


GC GAT T GGCT T C GTC AT GGT AC C C TT T GAAT AT AGGGGT GAACAG C AT AAAAC CT GT AT G 


1 9 n n 


Qy 


1205 


CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 


1264 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1201 


CT CAAT GC C ACAT CAAAAT T CAT GGAGTT CT AC CAAGAT GTAAAGGACT GGT GGCT CT T C 


Iz dU 


Qy 


1265 


GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 


1324 




II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1261 


GGGTTCTATTTCTGTATGCCCTTGGl Gi GCACl GCCjAi Ul 1 Ui/\L-AUUL.i UAi i i iji 


X sJ z u 


Qy 


1325 


GAGATGTTGAACAGAAGGAATGGCAGC 1 i GAGAAi i uuuc 1 UACji (jAAv^Ai U i i /\Aijt^/\(cr 


X v3 O 




1 1 II 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTG7\ACATCTTAAGCAG 


1380 


Qy 


1385 


CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 


1444 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 


1440 



Qy 


1445 


„™ — - rri m m f-^ -r\ f-^ m m -n -k <^ >^ m -n m Ti m m TV 7\ /"* 7\ 7\ TV TV m FTI TV rn TV TV TV TV TV rTl /"^ TV TV TV 7\ TV ^ 7\ 

C CT CT T CACT T AAGC C GT AT AT T GAAGAAAAL i G i G i A i AAG GAAA i GGACAACjAAU L. 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


CCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGA 


1500 


Qy 


1505 


T GT GAAT T act T AGT TT CT TACT G CT CAT GGAT TAC AT C G GT AT TAACTT GGCAACC AT G 






1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


1501 


TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 


1560 


Qy 


1565 


AAT T CAT GT ATAAAC C C CAT AG C T CT GT ATT T T GT GAGCAAGAAAT TT AAAAAT T GT TT C 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 




Db 


1561 


AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGA7\ATTTA7W\ATTGTTTC 


1620 


Qy 


1625 


CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGi CCCCAl G 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1621 


CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 


1680 


Qy 


1685 


ji^CGGAACAAGCAT CCAGT GQ'P<N:^1kKZZNZ<^K^ CAAAACAACCAChACACAGACCGGAGC 


T T /I /I 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1681 


AACGGAACAAGCATCCAGTGGAAGAACCACGATCAT^AACTUVCCACAACACAGACCGGAGC 


1740 


Qy 


1745 


AGC CAT AAGGACAGC AT GAACT GAC CAC C CT T AGAAG CACT C CT C G GT ACT C C CAT AAT C 


lo U4 




1 1 1 1 1 M 1 1 1 i 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


1741 


AGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAATC 


1800 


Qy 


1805 


CT CT CGGAGAAA7\AAAT C ACAAGGCAACT GT GAC T C C GGGAAT CT CT T CT CT GAT CCT T C 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


1801 


CTCTCGGAGAAA7WUVTCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTTC 


1860 


Qy 


1865 


T T C CTTAATT CACT C C CACAC CCAAGAAGAAAT GCT T T CCAAAACC GCAAGGT AGACT GG 


lyz 4 




M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


1861 


TTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTGG 


1920 


Qy 


1925 


TT T AT C CAC C CACAACAT CTACGAAT C GT ACT T CT T T7VAT T GAT CTAAT T TAC AT ATT CT 


1 y o 4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1921 


TTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTCT 


1980 


Qy 


1985 


GCGT GT T GT AT T CAGC ACT AAAAAAT G GT G GGAGCT GGGGGAGAAT GAAGACT GT TAAAT 


o n /I /I 
Z U4 4 




1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 M M M 1 1 M 1 1 1 1 1 




Db 


1981 


GCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAAT 


2040 


Qy 


2045 


GAAAC CAGAAGGATAT T T ACT ACTT T T GC AT GAAAAT AGAGC TT T CAAGT ACAT GGCT AG 


z 1 U4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


2041 


GAAACCAG7VAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTAG 


2100 


Qy 


2105 


CT T T TAT GGC AGT T CT GGT GAAT GT T CAAT GGGT^C T G GT CAC CAT GAAACT T T AGAGAT 


O'] C^A 

z 1 d4 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2101 


CTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGT^CTTTAGAGAT 


2160 


Qy 


2165 


m -pv A-^ -w\ #^ TV -A < -n m rn mm /~i m *t\ m m m m m m m t\ tv m 7\ rn rn rn rn rn rn m rp rri a TV TV TV TV TV TV TV ' M 

TAACGACAAGATTTTCTACTTTTTTTAAGTGAi 1 1 1 i i GiCCi i UAGULAAAOAUAAi Ai 


9 9 9 Zl 
Z Z Z ^ 




1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2161 


TAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATAT 


2220 


Qy 


2225 


GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 


2284 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2221 


GGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAAT 


2280 


Qy 


2285 


AGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAA7\AGACAAA7^TA 2344 



Db 


2281 


AGC CT AAC AT GAT TAT T T GAACTT AT T T AC AC AT AGTT T GAAAAAAAAAAGACAAAAAT A 


^ o 4 u 


Qv 


2345 


GTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACAC 


2404 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2341 


GT AT T C AGGT GAGC AAT T AGAT T AGT AT T T T C C AC GT C ACT AT T TAT T T T T T T AAAACAC 


o /I n n 
Z4 uu 


Qv 


2405 


AAATT CTAAAGCTACAACA7VAT ACT ACAGGC CCTT AAAGCACAGT CTGAT GACACATTT G 


2464 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


2401 


AAAT T CT AAAGCT ACAACAAAT ACT ACAGGC CCT TT^AAGC AC AGT CT GAT GAC ACAT TT G 




OV 


2465 


GCAGTTTAATAGATGTTACTC7VAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATGG 


2524 




1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 




Db 


2461 


GCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATGG 


o c o n 

2b2U 


Ov 


2525 


TGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTCA 


2584 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 




Db 


2521 


T GT T T TAT T ACAAGG GAC CT T GAAC AT GT T T T GT AT GT TAAAT T CAAAAGT AAT GCTT CA 


O Cl O Pl 


Ov 


2585 


ATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAAA 


2644 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2581 


AT C AGAT AGT T CT T T T T C ACAAGT T CAAT ACT GTT T TT C AT GTAAAT TT T GT AT GAAAAA 


Z OH U 


Ov 


2645 


TCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 


2704 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 




Db 


2641 


TCAATGTC7\AGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCAG 


o T n r» 
2 / 00 


Qv 


2705 


TGCACTGTATATAGTy^GTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATGA 


2764 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


2701 


TGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATGA 




Qv 


2765 


TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 


2824 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2761 


TTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCACC 


O O O A 

2820 


Qv 


2825 


TCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTTVAGTCTTTTTTGATCATTCC 


2884 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 




Db 


2821 


T CCT ATT CT CT T AAT TTT T GT TAA7\AT GT TAACT GGC AGT AAGT CT T TT T T GAT C AT T C C 


o Q Q n 
z o C) U 


Qv 


2885 


CTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAAA 


2944 




1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2881 


CTTTT CCATAT AGGAAACATAATTTT GAAGT GGC CAGAT GAGTTT AT CAT GT CAGT GAAA 


zy4U 


Qv 


2945 


AATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCAG 


3004 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


2941 


AAT AAT TAG C C ACAAAT GC C AC CAGTAACT TAAC GATT CT T C ACT T CTTGGGGTTTT CAG 


Q n n n 
JUUU 


Qy 


3005 


TATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGCC 


3064 




1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 




Db 


oUUl 


1 /\ i ox\r\Lj. \^ ± J\r\S^ ±\j^K^ U/t.^ ^ ^ IV^l'^V.^V-.lV^^ ± l\y X V^jt.v^ \^r\ XIX \^/^\r\rv\j\j\j\^\^ 


3060 


Qy 


3065 


CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAAA 


3124 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


3061 


CACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAAA 


3120 


Qy 


3125 


TCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATTT 


3184 



I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I 



Db 



3121 TCTTTTACTAGTGTGTGTGTGTATATATAT7VAACAATTGTAAATTTCTTTTAGCCCATTT 318 0 



Qy 3185 TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 3244 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 3181 TTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGTA 324 0 

Qy 3245 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3241 TGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTCT 3300 

Qy 3305 GAGCTT^AAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 3364 

I I I I I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 GAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGTA 3360 

Qy 3365 GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGAG 3424 

i I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 3361 GCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACA7\ATGGGATATAAGAG 3420 

Qy 3425 GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 84 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I 

Db 3421 GCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGGT 34 80 

Qy 3485 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 3544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3481 TTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACACT 3540 

Qy 3545 TTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3604 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 TTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGTC 3600 

Qy 3605 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATTT 3664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I 

Db 3601 TGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATTT 3660 

Qy 3 665 GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAG 3724 

I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3661 GTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAAG 3720 

Qy 3725 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 37 84 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3721 GCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCATC 3780 

Qy 3785 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 38 44 

I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 37 81 ATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACAA 38 40 

Qy 3845 TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAT^TWVATGCATTTTATAAATTC 3904 

M I I I I I I I I I I I I M I I M I I M I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I I M I 

Db 3841 TTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATTC 3900 

Qy 3905 AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGT7VAC 3964 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3901 AGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAAC 3960 

Qy 3 965 TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 4 024 

M I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3961 TGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGTA 4020 



Qy 



Db 




RESULT 1 

US-09-919-497-12 

; Sequence 12, Application US/09919497 

; Patent No. US20020106662A1 
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; APPLICANT: Mutter, George L. 

; TITLE OF INVENTION: PROGNOSTIC CLASSIFICATION OF ENDOMETRIAL CANCER 
; FILE REFERENCE: B0801/7225 

; CURRENT APPLICATION NUMBER: US/09/919, 4 97 

; CURRENT FILING DATE: 2001-07-31 

; PRIOR APPLICATION NUMBER: US 60/221,735 

; PRIOR FILING DATE: 2000-07-31 

; NUMBER OF SEQ ID NOS : 100 

; SOFTWT^E: Patentin version 3.0 

; SEQ ID NO 12 

LENGTH: 2595 

TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-919-497-12 

Query Match 60.2%; Score 2470; DB 9; Length 2595; 

Best Local Similarity 100,0%; Pred. No. 0; 

Matches 2481; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 

Qy 1624 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 1683 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 15 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCAT 74 

Qy 1684 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 174 3 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

75 GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 134 



Qy 



17 44 CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 18 03 




Db 



135 CAGCCATAAGGACAGCATGT^ACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 194 



Qy 



1804 CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 1863 




Db 



195 CCTCTCGGAGT^AAAAAATCACAAGGCTUVCTGTGACTCCGGGAATCTCTTCTCTGATCCTT 254 



Qy 



Db 



1864 CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTG 1923 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
255 CTTCCTTAATTCACTCCCACACCCAAGAAGA7VATGCTTTCCAAAACCGCAAGGTAGACTG 314 



Qy 



1924 GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 1983 




Db 



315 GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 374 



Qy 

Db 



1984 
375 



2043 
434 





2044 


Db 


435 


0\7 

wy 


2104 


Db 


495 




2164 


Db 


555 


r\\T 


99'? d 


uu 


615 








675 


wy 


^ o *± *± 


Db 


735 


ri\T 


94 04 

^ *1 u *1 


Db 


795 


yy 


94 f^4 

/I ^ D H 


Db 


855 


wy 


9 S9 4 


nh 


915 


wy 


9 SP14 

^ -J o 


Db 


975 


wy 


2644 


Db 


1034 


wy 


2704 


Db 


1094 


Qy 


2764 


Db 


1154 


Qy 


2824 


Db 


1214 



TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 2103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I 

TGAAACCAGAAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 4 94 

GCTTTTATGGCAGTTCTGGTGTU^TGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 2163 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I M M 
GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 554 

TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 2223 

I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I M I I I I I I I I I I I I I I I I I I I I 

TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 614 

TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 22 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGGCTCAGGTCACTTTTATTTGATVATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 67 4 

TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTG7\7\AAAAAAAAGACAAAAAT 2343 

I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
TAGCCTAACATGATTATTTG7\ACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAAT 734 

AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 24 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 7 94 

CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 24 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

CAAATTCTAAAGCTACAACA7y\TACTACAGGCCCTTA7^AGCACAGTCTGATGACACATTT 854 

GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 2523 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 914 

GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAT^TTCAAAAGTAATGCTTC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I M I I I I I I I I I I I I I I I I 

GTGTTTTATTACAAGGGACCTTG7\ACATGTTTTGTATGTTA7\ATTC7W\AGTAATGCTTC 97 4 

AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAA 2 64 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

AATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGAAAA 1033 

ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 27 03 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I M I 

ATCAATGTCAAGTACCA7\7U^TGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 1093 

GTGCACTGTATATAGAAGTCTATWVCACACCTAAGAGAAT^AAGATCGAATTTTTCAGATG 27 63 
I I I I I I I I I I I I I I I I I M I M I I I I I I I t I I M I I I M I I I I I I I I I I I I I I I I I I I I I 
GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 1153 

ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2823 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 1213 

CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 28 83 

I I I I I I I M M M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 1273 



Qy 


2884 


Db 


1274 


Qy 


2944 


Db 


1334 


Qy 


3004 


Db 


1394 


Qy 


3064 


Db 


1454 


Qy 


3124 


Db 


1514 


Qy 


3184 


Db 


1574 


Qy 


3244 


Db 


1634 


Qy 


3304 


Db 


1694 


Qy 


3364 


Db 


1754 


Qy 


3424 


Db 


1814 


Qy 


3484 


Db 


1874 


Qy 


3544 


Db 


1934 


Qy 


3604 


Db 


1994 


Qy 


3664 


Db 


2054 


Qy 


3724 



CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 2943 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M 

CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 1333 

AAATAATTACCCAC7WVTGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 3003 

I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I 

AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 1393 

GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 3063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I 

GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 1453 

CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 3123 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 1513 

ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 3183 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 157 3 

TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 3243 
I I I M M I I I I I I i I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 1633 

ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 3303 

II M I I I I II I I I I I I I II M I I I I II II I I I I II I I M II I 

ATGTATGGATTTAATCTAATCTT^TAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 1693 

TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 3363 
I I II II I I II I I I I I I I II I II I I I II I I I II I I I II I M I I II M I I II M II I I M II 
TGAGCTAAAATCTAGGTGATTGTTCATCATGACT^CCTGCCTCAGTCCATTTTAACCTGT 1753 

AGCAACCTTCTGCATTCATA7VATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 3423 

I I I I I I I I I I II I I I I I I I M II I I II I I I I I I I I II I II I I I I I I II I I I I I II I I I II 

AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACA7UVTGGGATATAAGA 1813 

GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 3483 

I I I II I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II II I I I I II 

GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 1873 

TTTGAT7WVGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 3543 

I I I II I I I II II I II I I I I II I I I I I I I II I II II II I I I I I I II I II II II II I I I I II 

TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 1933 

TTTGT^AGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 3603 

I I I I I II I I I II I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I II II I II I I I I I I I 

TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATG7WVTTGCCAGGTTGT 1993 

CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 3663 

II I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I I I I I I I I I M I I I I I I I I I I II I 

CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 2053 

TGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAA 3723 

I I I I I II I I I I I I I I I I I II I I I I I M II I I I II I I I I I I I I M 

TGTTGGGCCATATTTTAGGACAGGT7W\ATAACATCAGGTTCCAGTTGCTTGAATTGC7^ 2113 

GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 3783 







1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 




Db 


2114 


GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 


2173 


Qy 


3784 


CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 


3843 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2174 


CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 2233 


Qy 


3844 


ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 


3903 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 N 1 




Db 


2234 


ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 


2293 


Qy 


3904 


CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTT^GTAA 


3963 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2294 


CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 


2353 


Qy 


3964 


CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 


4023 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 




Db 


2354 


CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 


2413 


Qy 


4024 


AACTTTGTAGAAATGAGCCAGAAGCC7VAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 


4083 




1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


2414 


AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 


2473 



Qy 408 4 AATAAAAGTTTACAGAi^ACCTT 4105 

I I M I I I I I I I I I I I I I I I I I I 
Db 2474 AATAAAAGTTTACAGAAACCTT 24 95 



RESULT 8 

US-10-204-752-30 

; Sequence 30, Application US/10204752 
; Publication No, US20030152956A1 
; GENERAL INFORMATION: 

; APPLICANT: OHTANI, No. US20030152 956Aliko 
; APPLICANT: MATSUI, Keiko 
; APPLICANT: YOSHIDA, Nei 
; APPLICANT: SUGITA, Yuji 
; APPLICANT: IZUHARA, Kenji 

; TITLE OF INVENTION: METHOD OF TESTING FOR ALLERGIC DISEASE 

FILE REFERENCE: SHZ-009US 
; CURRENT APPLICATION NUMBER: US/ 10/2 04 , 752 
; CURRENT FILING DATE: 2002-08-23 

PRIOR APPLICATION NUMBER: JP 2000-396166 
; PRIOR FILING DATE: 2000-12-26 
; NUMBER OF SEQ ID NOS : 37 
; SOFTWARE: PatentIn Ver. 2.1 
; SEQ ID NO 30 

LENGTH: 2595 
TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-204-752-30 



Query Match 60.2%; Score 2470; DB 15; Length 2595; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2481; Conservative 0; Mismatches 0; Indels 1; Gaps 1; 



Qy 1624 CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCTWVAGTCTGATGACCTCGGTCCCCAT 1683 



Db 


15 


Ov 
vY 


1684 


Db 


75 


C)\7 


1744 


Db 


135 




J. O U *1 




195 


yy 


1 ft fid 

X O D ri 


Db 


255 


yy 


X -7 ^ t 


Db 


315 


yy 


1 Cift4 

X ^ O 


Db 


375 


wy 


904 4 

^rl \J ri 1 




435 


yy 


91 (14 

X U 1 




495 


yy 


^ X D *1 


Db 


555 


yy 


9994 


Db 


615 


yy 


99ft4 
^ ^ (J *i 


Db 


675 


Ov 


2344 


Db 


735 


Qy 


2404 


Db 


795 


Qy 


2464 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M M I I I I I M I I I I I I I 

CCAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAT^AGTCTGATGACCTCGGTCCCCAT 7 4 

GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 1743 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I 

GAACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAG 134 

CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 1803 

I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I M I 

CAGCCATAAGGACAGCATGAACTGACCACCCTTAGAAGCACTCCTCGGTACTCCCATAAT 194 

CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 18 63 

I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTCTCGGAGAAAAAAATCACAAGGCAACTGTGACTCCGGGAATCTCTTCTCTGATCCTT 254 

CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAAACCGCAAGGTAGACTG 1923 

I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I 

CTTCCTTAATTCACTCCCACACCCAAGAAGAAATGCTTTCCAAT^CCGCAAGGTAGACTG 314 

GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 19 83 

I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

GTTTATCCACCCACAACATCTACGAATCGTACTTCTTTAATTGATCTAATTTACATATTC 374 

TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 204 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

TGCGTGTTGTATTCAGCACTAAAAAATGGTGGGAGCTGGGGGAGAATGAAGACTGTTAAA 434 

TGA7y^.CCAGAAGGATATTTACTACTTTTGCATGAA7^TAGAGCTTTCAAGTACATGGCTA 2103 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I M M I 

TGAAACCAG7VAGGATATTTACTACTTTTGCATGAAAATAGAGCTTTCAAGTACATGGCTA 494 

GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATG7\AACTTTAGAGA 2163 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

GCTTTTATGGCAGTTCTGGTGAATGTTCAATGGGAACTGGTCACCATGAAACTTTAGAGA 554 

TTAACGACAAGATTTTCTACTTTTTTTAAGTGATTTTTTGTCCTTCAGCCAAACACAATA 2223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I 

TTAACGACAAGATTTTCTACTTTTTTTT^GTGATTTTTTGTCCTTCAGCCAAACACAATA 614 

TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 22 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGGCTCAGGTCACTTTTATTTGAAATGTCATTTGGTGCCAGTATTTTTTAACTGCATAA 674 

TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAAAT 2343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I 

TAGCCTAACATGATTATTTGAACTTATTTACACATAGTTTGAAAAAAAAAAGACAAAj\AT 734 

AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 24 03 

I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I 
AGTATTCAGGTGAGCAATTAGATTAGTATTTTCCACGTCACTATTTATTTTTTTAAAACA 7 94 

CAAATTCTAAAGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 24 63 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I N I I I I I I 

CAAATTCTA7UVGCTACAACAAATACTACAGGCCCTTAAAGCACAGTCTGATGACACATTT 854 

GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 2523 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



855 GGCAGTTTAATAGATGTTACTCAAAG7\ATTTTTTAAGAACTGTATTTTATTTTTTAAATG 914 

2524 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAT^AGTAATGCTTC 2583 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M 

915 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTC 974 

2584 AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATGAAAA 2 643 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I 

975 AATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGA7\AA 1033 

2644 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 2703 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1034 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 1093 

2704 GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCG7\ATTTTTCAGATG 2763 

I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M M 
1094 GTGCACTGTATATAGAAGTCTAAAACACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 1153 

2764 ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

1154 ATTCGGTVAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 1213 

2824 CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 2 8 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

1214 CTCCTATTCTCTTAATTTTTGTTAAAATGTTT^ACTGGCAGTAAGTCTTTTTTGATCATTC 1273 

28 8 4 CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 2 943 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
1274 CCTTTTCCATATAGGAAACATAATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 1333 

2944 AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 3003 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1334 7\AATAATTACCCACAAATGCCACCAGTAACTT7\ACGATTCTTCACTTCTTGGGGTTTTCA 1393 

3004 GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTCAAAGGGC 3063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1394 GTATGAACCTAACTCCCCACCCCAACATCTCCCTCCCACATTGTCACCATTTC7WVGGGC 1453 

3064 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 3123 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1454 CCACAGTGACTTTTGCTGGGCATTTTCCCAGATGTTTACAGACTGTGAGTACAGCAGAAA 1513 

3124 ATCTTTTACTAGTGTGTGTGTGTATATATATAAACAATTGTAAATTTCTTTTAGCCCATT 318 3 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1514 ATCTTTTACTAGTGTGTGTGTGTATATATATA7\ACAATTGTAAATTTCTTTTAGCCCATT 1573 

3184 TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 32 43 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
1574 TTTCTAGACTGTCTCTGTGGAATATATTTGTGTGTGTGATATATGCATGTGTGTGATGGT 1633 

3244 ATGTATGGATTTT^TCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 3303 

I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1634 ATGTATGGATTTAATCTAATCTAATAATTGTGCCCCGCAGTTGTGCCAAAGTGCATAGTC 1693 

3304 TGAGCT7VAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 3363 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
1694 TGAGCTAAAATCTAGGTGATTGTTCATCATGACAACCTGCCTCAGTCCATTTTAACCTGT 1753 



Qy 3364 AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 3423 

I I I I I I I I I I I I I M I M I I I I I I I I I I I I I Ml I I I I I I I I I I I I Ml I I I I I I I I I I I 
Db 1754 AGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATTACAAATGGGATATAAGA 1813 

Qy 3424 GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 34 83 

I I I I I I I I I I I I M M M M M M M M M M I M M M I M M M M M M M M I M I 

Db 1814 GGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGTTTTGTTTGGTTGGTTGG 18 73 

Qy 3484 TTTGATA7UVGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCAAAAGTCATTACAC 354 3 

M M M M M M M M M I M M I M M M M M M M M M M M M M M M I M M I 

Db 1874 TTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGGAGCA7y\AGTCATTACAC 1933 

Qy 3544 TTTG7\AGTATTATATTGTTCTTATCCTC7VATTCAATGTGGTGATG7VAATTGCCAGGTTGT 3603 

I I I I I I I I I I I I I M M M M M M M M M M I M M M I M M M M M M M M M I 
Db 1934 TTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGATGAAATTGCCAGGTTGT 1993 

Qy 3604 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATATVATTAGGTAAGATAATT 3663 

I I I I I I I I I I M I M M M M M M M M M M M M M M M M M M M M I M M M 
Db 1994 CTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATAAATTAGGTAAGATAATT 2053 

Qy 3664 TGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCCAGTTGCTTGAATTGCAA 3723 

I I I I I I I I I I I I I I I I I I M M M M M M M M M M M M M M M M I M M I M M 

Db 2054 TGTTGGGCCATATTTTAGGACAGGTA7WVT7\ACATCAGGTTCCAGTTGCTTGAATTGCAA 2113 

Qy 3724 GGCTTy^GAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 3783 

I I I I I I I I I I I I I I I I I I M M I M M M M M M M M M M M I M M M M M I M I 

Db 2114 GGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTATTATTCCACTGGCGCAT 217 3 

Qy 3784 CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 3843 

I I I I I I I I I I I I I I I I I M M M M M M I M M M M M M M M M M M M I M M I 

Db 2174 CATATGCAGTGATATATGCCTATAATATAAGCCATAGGTTCACACCATTTTGTTTAGACA 2233 

Qy 3844 ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAAAAAATGCATTTTATAAATT 3903 

I I I I I I I M M I M M I M M M M I M M M M M I I M M I M M M M M M M M I 

Db 2234 ATTGTCTTTTTTTCAAGATGCTTTGTTTCTTTCATATGAAATW^TGCATTTTATAAATT 22 93 

Qy 3904 CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 3963 

I I I I I I I I M M M M M M M M M M M M M M M M M M M M M M M M I M I 

Db 22 94 CAGAAAGTCATAGATTTCTGAAGGCGTCAACGTGCATTTTATTTATGGACTGGTAAGTAA 2353 

Qy 3964 CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 402 3 

M M M M M M M M M M M M M M M I M I M I M M M M M M M I M M M I I 

Db 2354 CTGTGGTTTACTAGCAGGAATATTTCCAATTTCTACCTTTACTACATCTTTTCAACAAGT 2413 

Qy 4024 AACTTTGTAGA7\ATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 4083 

M M M M M M M M M M M M M I M M M M M M M M M M M M M M M M I 

Db 2414 AACTTTGTAGAAATGAGCCAGAAGCCAAGGCCCTGAGTTGGCAGTGGCCCATAAGTGTAA 2473 

Qy 4084 AATAAAAGTTTACAGAAACCTT 4105 

M M M M I M M M M M M I 

Db 2474 AATAAAAGTTTACAGAAACCTT 24 95 



RESULT 9 

US-09-826-509-494 

; Sequence 494, Application US/09826509 



Publication No. US20030204073A1 
GENERAL INFORMATION: 
APPLICANT: Lehmann-Bruinsma, Karin 
APPLICANT: Liaw, Chen W. 
APPLICANT: Lin, I-Lin 

TITLE OF INVENTION: No. US2 0030204 073A1-Endogenous , Constitutively Activated 
Known G 

TITLE OF INVENTION: Protein-Coupled Receptors 
FILE REFERENCE: AREN-207 

CURRENT APPLICATION NUMBER: US/09/826, 509 
CURRENT FILING DATE: 2001-04-05 
PRIOR APPLICATION NUMBER: 60/195,747 
PRIOR FILING DATE: 2000-04-07 
PRIOR APPLICATION NUMBER: 09/170,496 
PRIOR FILING DATE: 1998-10-13 
NUMBER OF SEQ ID NOS : 589 
SOFTWARE; Patentin Version 2.1 
SEQ ID NO 494 
LENGTH: 12 84 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-826-509-494 

Query Match 31.2%; Score 1280.8; DB 11; Length 1284; 

Best Local Similarity 99.8%; Pred. No. 4.9e-311; 

Matches 1282; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGAAACCCTTTGCCTCAGGGCATCCTTTTGGCTGGCACTGGTTGGATGTGTAATCAGT 60 

GATAATCCTGAGAGATACAGCACAAATCT7\AGCAATCATGTGGATGATTTCACCACTTTT 604 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

GATAATCCTGAGAGATACAGCACAAATCTAAGCTKATCATGTGGATGATTTCACCACTTTT 120 

CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

CGTGGCACAGAGCTCAGCTTCCTGGTTACCACTCATCAACCCACTAATTTGGTCCTACCC 180 

AGCAATGGCTCAATGCACAACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGCAATGGCTCAATGCACTVACTATTGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAA 240 

TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGAATGCAACT 7 84 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

TACATTAACACTGTGATATCTTGTACTATTTTCATCGTGGGAATGGTGGGGTUVTGCAACT 300 

CTGCTCAGGATCATTTACCAGAACAAATGTATGAGGAATGGCCCCAACGCGCTGATAGCC 8 44 

I M I I I I I I I I I I M I M I I I I I M I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

CTGCTCAGGATCATTTACCAGAACAT^TGTATGAGGAATGGCCCCAACGCGCTGATAGCC 360 

AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 904 

I I I I I I I I I I I I I I I I I I I I I M I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGTCTTGCCCTTGGAGACCTTATCTATGTGGTCATTGATCTCCCTATCAATGTATTTAAG 42 0 

CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 964 
I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I 



Qy 


485 


Db 


1 


Qy 


545 


Db 


61 


Qy 


605 


Db 


121 


Qy 


665 


Db 


181 


Qy 


725 


Db 


241 


Qy 


785 


Db 


301 


Qy 


845 


Db 


361 


Qy 


905 



Db 



421 CTGCTGGCTGGGCGCTGGCCTTTTGATCACAATGACTTTGGCGTATTTCTTTGCAAGCTG 480 



Qy 


965 


Db 


481 


Qy 


1025 


Db 


541 


Qy 


1085 


Db 


601 


Qy 


1145 


Db 


661 


Qy 


1205 


Db 


721 


Qy 


1265 


Db 


781 


Qy 


1325 


Db 


841 


Qy 


1385 


Db 


901 


Qy 


1445 


Db 


961 


Qy 


1505 


Db 


1021 


Qy 


1565 


Db 


1081 


Qy 


1625 


Db 


1141 


Qy 


1685 


Db 


1201 


Qy 


1745 


Db 


1261 



TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 1024 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I j I I I I I I I I I I I I I I I I I I I I I I I 

TTCCCCTTTTTGCAGAAGTCCTCGGTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGT 54 0 

GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGTVATTGGGATTCCTTTG 108 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I 

GTTGACAGGTACAGAGCAGTTGCCTCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTG 600 

GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAA 1144 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i M I I I M 

GTAACTGCCATTGAAATTGTCTCCATCTGGATCCTGTCCTTTATCCTGGCCATTCCTG7\A 660 

GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 1204 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

GCGATTGGCTTCGTCATGGTACCCTTTGAATATAGGGGTGAACAGCATAAAACCTGTATG 720 

CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 1264 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I t I I I I I I I I I I I 

CTCAATGCCACATCAAAATTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTC 7 80 

GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 1324 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M 

GGGTTCTATTTCTGTATGCCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGT 840 

GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 1384 
I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
GAGATGTTGAACAGAAGGAATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAG 900 

CGTCGAGAAGTGGCAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 1444 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I M I I 

CGTCGAG7\AGTGAAAAAAACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTC 960 

CCTCTTCACTT7\AGCCGTATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGA 1504 

I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

CCTCTTCACTTAAGCCGTATATTGAAGAAAACTGTGTATAACG7VAATGGACAAGAACCGA 1020 

TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1564 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I 

TGTGAATTACTTAGTTTCTTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATG 1080 

AATTCATGTATAAACCCCATAGCTCTGTATTTTGTGAGCAAGATVATTTAAAAATTGTTTC 1624 

M I I I I I I I M I i I I I I I I I I I I I I I I I I I I I I I I M I M M I I I I I I I I I I I I I I I I I I 

AATTCATGTAT7y\ACCCCATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTC 1140 

CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 1684 
M I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I 
CAGTCATGCCTCTGCTGCTGCTGTTACCAGTCCAAAAGTCTGATGACCTCGGTCCCCATG 12 00 

AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 1744 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

AACGGAACAAGCATCCAGTGGAAGAACCACGATCAAAACAACCACAACACAGACCGGAGC 1260 



I I I I I I I I I I I I I I I I I M I I I I I 



RESULT 10 
US-10-101-510-59 

; Sequence 59, Application US/10101510 

; Publication No. US20030148295A1 

; GENERAL INFORMATION: 

; APPLICANT: WAN, JACKSON 

; APPLICANT: WANG, YIXIN 

; TITLE OF INVENTION: EXPRESSION PROFILES AND METHODS OF USE 
; FILE REFERENCE: 15117.0012 

; CURRENT APPLICATION NUMBER: US/10/101, 510 
; CURRENT FILING DATE: 2002-03-20 

PRIOR APPLICATION NUMBER: 60/276,947 
; PRIOR FILING DATE: 2001-03-20 
; NUMBER OF SEQ ID NOS : 805 

SOFTWARE: Patentin Ver. 2.1 
; SEQ ID NO 59 

LENGTH: 560 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
US-iO-101-510-59 

Query Match 12.7%; Score 521; DB 15; Length 560; 

Best Local Similarity 97.7%; Pred. No. 4e-120; 

Matches 550; Conservative 0; Mismatches 10; Indels 3; Gaps 2; 

Qy 2464 GGCAGTTTAATAGATGTTACTC7V7\AGAATTTTTTAAGAACTGTATTTTATTTTTTA7UVTG 2523 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 GGCAGTTTAATAGATGTTACTCAAAGAATTTTTTAAGAACTGTATTTTATTTTTTAAATG 60 

Qy 2524 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAT^ATTCATWVGTAATGCTTC 2583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GTGTTTTATTACAAGGGACCTTGAACATGTTTTGTATGTTAAATTCAAAAGTAATGCTTC 120 

Qy 2584 AATCAGATAGTTCTTTTTCACAAGTTCAATACTGTTTTTCATGTAAATTTTGTATG7W\A 2 643 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I 

Db 121 AATCAGATAGTTCTTTTTCACAAGTTCAAT-CTGTTTTTCATGTAAATTTTGTATGAAAA 17 9 

Qy 2644 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 2703 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i i I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 0 ATCAATGTCAAGTACCAAAATGTTAATGTATGTGTCATTTAACTCTGCCTGAGACTTTCA 239 

Qy 2704 GTGCACTGTATATAGAAGTCTTW^CACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 2763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 0 GTGCACTGTATATAGAAGTCTA7WVCACACCTAAGAGAAAAAGATCGAATTTTTCAGATG 299 

Qy 2764 ATTCGGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 2823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 ATTCAGAAATTTTCATTCAGGTATTTGTAATAGTGACATATATATGTATATACATATCAC 359 

Qy 282 4 CTCCTATTCTCTTAATTTTTGTTAAAATGTTAACTGGCAGTAAGTCTTTTTTGATCATTC 28 83 

I I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 CTCCTATTCTCTTAATTTTTCTTAAAATGTTAACTGGCAGTAAAGCTTTTTTGATCATTC 419 

Qy 2884 CCTTTTCCATATAGGAAACATT^TTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 2943 

I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



42 0 CCTTTTCCATATAGGAAACATTVATTTTGAAGTGGCCAGATGAGTTTATCATGTCAGTGAA 47 9 



Qy 



Db 



2944 AAATAATTACCCACAAATGCCACCAGTAACTTAACGATTCTTCACTTCTTGGGGTTTTCA 30 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 80 AAATTAATACCCACAAATGGCACCAG — AACTTACGATTCTTCACTTCTTGGGGTTTTCA 537 



Qy 



3004 GTATG7\ACCTAACTCCCCACCCC 302 6 




Db 



538 GTATGAACCTAACTCCCCACCCC 560 



RESULT 11 

US- 10-085-7 83A-4 1606 

; Sequence 41606, Application US/10085783A 
; Publication No. US20040037841A1 
; GENERAL INFORMATION: 

APPLICANT: ChondroGene Inc. 
; APPLICANT: Liew, C.C. 

; TITLE OF INVENTION: Compositions and Methods Relatiing to Osteoarthritis 
; FILE REFERENCE: 4231/2002 

; CURRENT APPLICATION NUMBER: US/10/085, 783A 

CURRENT FILING DATE: 2002-02-28 
; PRIOR APPLICATION NUMBER: US 60/305,340 
PRIOR FILING DATE: 2001-07-13 
PRIOR APPLICATION NUMBER: US 60/275,017 
; PRIOR FILING DATE: 2001-03-12 
; PRIOR APPLICATION NUMBER: US 60/271,955 
; PRIOR FILING DATE: 2001-02-28 
; NUMBER OF SEQ ID NOS : 58 994 
; SOFTWARE: PatentIn version 3.2 
; SEQ ID NO 41606 

LENGTH: 4 68 

TYPE: DNA 

ORGANISM: Human 

FEATURE: 
; NAME/KEY: misc_feature 

LOCATION: (12) . . (12) 
; OTHER INFORMATION: n is a, c, g, or t 

FEATURE : 
; NAME/KEY: misc_feature 
; LOCATION: (415) . . (415) 

OTHER INFORMATION: n is a, c, g, or t 
US-10-085-783A-41606 

Query Match 10.9%; Score 446.2; DB 13; Length 468; 

Best Local Similarity 97.8%; Pred. No. 2.3e-101; 

Matches 451; Conservative 0; Mismatches 10; Indels 0; Gaps 0; 



Qy 



3573 ATTCAATGTGGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACA 3632 




Db 



8 AATTNATGTGGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACA 67 



Qy 



Db 



3633 GATTGCTGAT7\ATAAATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGT7VAAA 3692 

I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

68 GATTGCTGAT7\AT7\AATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTAAAA 127 



3693 TAACATCAGGTTCCAGTTGCTTGAATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTT 3752 



I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I 

Db 128 TAACATCAGGTTCCAGTTGCTTGAATTACAAGGCTAAGAAGTACTGCCCTTTTGTGTGTT 187 

Qy 3753 AGCAGTCAAATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTATAATATA 3812 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 188 AGCAGTCAAATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTATAATATA 247 

Qy 3813 AGCCATAGGTTCACACCATTTTGTTTAGACAATTGTCTTTTTTTCAAGATGCTTTGTTTC 3872 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 248 AGCCATAGGTTCACACCATTTTGTTTAGACAATTGTCTTTTTTTCAAGATGCTTTGTTTC 307 

Qy 3873 TTTCATATGAAAAAAATGCATTTTATAAATTCAGAAAGTCATAGATTTCTGAAGGCGTCA 3932 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 308 TTTCATATGAAAAAAATGCATTTTATAAATTCAGAAAGTCATAGATTTCTGAAGGCGTCA 367 

Qy 3933 ACGTGCATTTTATTTATGGACTGGTAAGTAACTGTGGTTTACTAGCAGG7\ATATTTCCAA 3992 

I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I II I I II I I I I I II I I I I I II I I I 

Db 368 ACGTGCATTTTATTTATGGACTGGTT^AGTACTGGGGGGTTACTAGCANGAATATTTCCAA 427 

Qy 3993 TTTCTACCTTTACTACATCTTTTCAACAAGTAACTTTGTAG 4033 

II I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 428 TTTCTACCTTTACTACATCTTTTCAACAAGTAACTTTGTAG 4 68 



RESULT 12 

US-10-242-535A-41606 

; Sequence 41606, Application US/10242535A 
; Publication No. US20040013663A1 
; GENERAL INFORMATION: 

APPLICANT: ChondroGene Inc. 
; APPLICANT: Liew, C.C. 

TITLE OF INVENTION: Compositions and Methods Relatiing to Osteoarthritis 
; FILE REFERENCE: 4231/2005 

; CURRENT APPLICATION NUMBER: US/ 10/242 , 535A 
; CURRENT FILING DATE: 2002-09-12 
; PRIOR APPLICATION NUMBER; US 10/085,783 
PRIOR FILING DATE: 2002-02-28 
PRIOR APPLICATION NUMBER: US 60/305,340 
; PRIOR FILING DATE: 2001-07-13 

PRIOR APPLICATION NUMBER: US 60/275,017 
; PRIOR FILING DATE: 2001-03-12 
; PRIOR APPLICATION NUMBER: US 60/271,955 
; PRIOR FILING DATE: 2001-02-28 
; NUMBER OF SEQ ID NOS : 58994 
; SOFTWARE: Patentin version 3.2 
; SEQ ID NO 41606 
LENGTH: 468 
TYPE: DNA 
ORGANISM: Human 
FEATURE : 

NAME/KEY: misc_feature 
LOCATION: (12).. (12) 

OTHER INFORMATION: n is a, c, g, or t 
FEATURE: 
; NAME/KEY: misc_feature 
LOCATION: (415).. (415) 

OTHER INFORMATION: n is a, c, g, or t 



US-10-242-535A-41606 



Query Match 10.9%; Score 446.2; DB 16; Length 468; 

Best Local Similarity 97.8%; Pred. No. 2.3e-101; 

Matches 451; Conservative 0; Mismatches 10; Indels 0; Gaps 0; 

Qy 3573 ATTCAATGTGGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACA 3632 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8 AATTNATGTGGTGATGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACA 67 

Qy 3633 GATTGCTGATAATAAATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTAAAA 3692 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 68 GATTGCTGATAATAAATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTT^TUy^. 127 

Qy 3693 TAACATCAGGTTCCAGTTGCTTGAATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTT 3752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 1 I I I I I I I I 

Db 12 8 TAACATCAGGTTCCAGTTGCTTGAATTACAAGGCTAAG7\AGTACTGCCCTTTTGTGTGTT 187 

Qy 3753 AGCAGTCAAATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTATAATATA 3812 

I M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 8 AGCAGTCAAATCTATTATTCCACTGGCGCATCATATGCAGTGATATATGCCTAT7\ATATA 247 

Qy 3813 AGCCATAGGTTCACACCATTTTGTTTAGACAATTGTCTTTTTTTCAAGATGCTTTGTTTC 3872 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 24 8 AGCCATAGGTTCACACCATTTTGTTTAGACAATTGTCTTTTTTTCAAGATGCTTTGTTTC 307 

Qy 3873 TTTCATATGAAAAAAATGCATTTTATAAATTCAGAAAGTCATAGATTTCTG7\AGGCGTCA 3932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 308 TTTCATATGAAAAAAATGCATTTTATA7VATTCAGAAAGTCATAGATTTCTGAAGGCGTCA 367 

Qy 3933 ACGTGCATTTTATTTATGGACTGGTAAGTAACTGTGGTTTACTAGCAGGAATATTTCCAA 3992 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II M I II I I I I I I II I I I I 

Db 368 ACGTGCATTTTATTTATGGACTGGTAAGTACTGGGGGGTTACTAGCANGAATATTTCCAA 427 

Qy 3993 TTTCTACCTTTACTACATCTTTTCAACAAGTAACTTTGTAG 4033 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 8 TTTCTACCTTTACTACATCTTTTCj\AC7\AGTAACTTTGTAG 468 



RESULT 13 

US-09-918-995-8960 

; Sequence 8960, Application US/09918995 

; Publication No. US20030073623A1 

; GENERAL INFORMATION: 

; APPLICANT: Hyseq, Inc. 

; TITLE OF INVENTION: NOVEL NUCLEIC ACID SEQUENCES OBTAINED 
; TITLE OF INVENTION: FROM VARIOUS cDNA LIBRARIES 
; FILE REFERENCE: 20411-756 

; CURRENT APPLICATION NUMBER: US/ 09/918 , 995 

; CURRENT FILING DATE: 2001-07-30 

; PRIOR APPLICATION NUMBER: US/09/235,076 

; PRIOR FILING DATE: 1999-01-20 

; NUMBER OF SEQ ID NOS : 38054 

; SOFTWARE: FastSEQ for Windows Version 3.0 

; SEQ ID NO 8960 

LENGTH: 451 

TYPE: DNA 



; ORGT^NISM: Homo sapiens 

FEATURE: 
; NAME/KEY: misc_f eature 

LOCATION: (1) . . . (451) 

OTHER INFORMATION: n == A,T,C or G 
US-09-918-995-8960 

Query Match 10.0%; Score 412.4; DB 10; Length 451; 

Best Local Similarity 98.6%; Pred. No. 7.3e-93; 

Matches 416; Conservative 0; Mismatches 6; Indels 0; Gaps 0; 

Qy 3347 AGTCCATTTTAACCTGTAGCAACCTTCTGCATTCATAAATCTTGTAATCATGTTACCATT 3406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 9 AATTCATTTTAACCTGTAGC7\ACCTTTTGCATTCATAAATCTTGTAATCATGTTACCATT 88 

Qy 3407 ACAAATGGGATATAAGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGT 3466 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 8 9 ACAAATGGTATATAAGAGGCAGCGTGAAAGCAGATGAGCTGTGGACTAGCAATATAGGGT 14 8 

Qy 3467 TTTGTTTGGTTGGTTGGTTTGATAAAGCAGTATTTGGGGTCATATTGTTTCCTGTGCTGG 352 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 9 TTTGTTTGGTTGGTTGGTTTGATAAAACAGTATTTGGGGTCATATTGATTCCTGTGCTGG 208 

Qy 3527 AGCAAAAGTCATTACACTTTGAAGTATTATATTGTTCTTATCCTCAATTC7VATGTGGTGA 3586 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 209 AGCAAAAGTCATTACACTTTGAAGTATTATATTGTTCTTATCCTCAATTCAATGTGGTGA 268 

Qy 3587 TGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGATAATA 364 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I [ I I I I M I I I I I I I I I 

Db 269 TGAAATTGCCAGGTTGTCTGATATTTCTTTCAGACTTCGCCAGACAGATTGCTGAT7\ATA 32 8 

Qy 3647 AATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTAT^AATAACATCAGGTTCC 3706 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 329 AATTAGGTAAGATAATTTGTTGGGCCATATTTTAGGACAGGTAAAATAACATCAGGTTCC 388 

Qy 3707 AGTTGCTTGAATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCTWVTCTA 3766 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 38 9 AGTTGCTTGAATTGCAAGGCTAAGAAGTACTGCCCTTTTGTGTGTTAGCAGTCAAATCTA 448 

Qy 3767 TT 3768 

I I 

Db 449 TT 450 



RESULT 14 

US-10-305-720-1203 

; Sequence 1203, Application US/10305720 
; Publication No. US20040010136A1 
; GENERAL INFORMATION: 

; APPLICANT: Au-Young, Janice K. ; Seilhamer, Jeffrey J, 

; TITLE OF INVENTION: Composition for the Detection of Signaling Pathway Gene 
Expression 

FILE REFERENCE: PA-0002-1 CON 
; CURRENT APPLICATION NUMBER: US/ 10/305 , 720 
; CURRENT FILING DATE: 2002-11-26 

PRIOR APPLICATION NUMBER: 09/016,434 
; PRIOR FILING DATE: 1998-01-30 



NUMBER OF SEQ ID NOS : 149 0 
SOFTWARE: PERL Program 
SEQ ID NO 1203 
LENGTH: 1470 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc_feature 

OTHER INFORMATION: GenBank ID No. US20040010136A1 gl82275 
US-10-305-720-1203 

Query Match 9.6%; Score 395.8; DB 16; Length 1470; 

Best Local Similarity 65.7%; Pred. No. 2,7e-88; 

Matches 634; Conservative 0; Mismatches 307; Indels 24; Gaps 3; 

Qy 689 TGCCCACAGCAGACTAAAATTACTTCAGCTTTCAAATACATTAACACTGTGATATCTTGT 74 8 

Mill I I I I I I I I I I I I I I M I II I I I I I II I II M 

Db 314 TGCCAAGGACCCATCGAGATCAAGGAGACTTTCAAATACATCAACACGGTTGTGTCCTGC 37 3 

Qy 74 9 ACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAAC 8 08 

I I I I I I I II I II I I I II I I M II I I I I I I I I I II I I I M 

Db 374 CTTGTGTTCGTGCTGGGGATCATCGGGAACTCCACACTTCTGAGAATTATCTACAAGAAC 433 

Qy 809 AAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATC 8 68 

I I I I II I I M II I II M I I I I I I I II I I I I I I II I I I I I I 

Db 4 34 AAGTGCATGCGAAACGGTCCCTU^TATCTTGATCGCCAGCTTGGCTCTGGGAGACCTGCTG 493 

Qy 8 69 TATGTGGTCATTGATCTCCCTATCAATGTATTTTyVGCTGCTGGCTGGGCGCTGGCCTTTT 92 8 

I I I I I I I I II I I I I I I I I I M II I I I I II I I M I I I I I I II I I 

Db 494 CACATCGTCATTGACATCCCTATCT^TGTCTACAAGCTGCTGGCAGAGGACTGGCC 549 

Qy 929 GATCACAATGACTTTGGCGTATTTCTTTGC7UVGCTGTTCCCCTTTTTGCAGAAGTCCTCG 98 8 

I I I II I I M I M I I I I I I M I I I I I I I II I 

Db 550 ATTTGGAGCTGAGATGTGTAAGCTGGTGCCTTTCATACAGAAAGCCTCC 598 

Qy 989 GTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCC 104 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I II I I I 

Db 599 GTGGGAATCACTGTGCTGAGTCTATGTGCTCTGAGTATTGACAGATATCGAGCTGTTGCT 658 

Qy 104 9 TCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCC 1108 

I I I I I I I I I I I I M I I I I I I I I I II I I I I I I M I II I I I 

Db 659 TCTTGGAGTAGAATTAAAGGAATTGGGGTTCCAAAATGGACAGCAGTAGAAATTGTTTTG 718 

Qy 1109 ATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCC 1168 

I I I I I I III I I I I I II I I I I M I I I II I I II I II I I 

Db 719 ATTTGGGTGGTCTCTGTGGTTCTGGCTGTCCCTG7\AGCCATAGGTTTTGATATAATTACG 778 

Qy 1169 TTTGAATATAGGGGTGT^CAGCATAAAACCTGTATGCTCAATGCC ACATCAAAA 1222 

MINI II II I I I I I II I I II I I I M 

Db 77 9 ATGGACTACAAAGGAAGTTATCTGCGAATCTGCTTGCTTCATCCCGTTCAGAAGACAGCT 838 

Qy 1223 TTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATG 12 82 

I I I M I I I I I I M I I I I I I I I I I I I I I I I M I I I M I I I I I II II 

Db 839 TTCATGCAGTTTTACAAGACAGCAAAAGATTGGTGGCTGTTCAGTTTCTATTTCTGCTTG 8 98 

Qy 1283 CCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGG 1342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 



Db 



899 CCATTGGCCATCACTGCATTTTTTTATACACTAATGACCTGTGAAATGTTG AG7\AAG 955 



Qy 1343 AATGGCAGCTTGAGAATTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCAAAA 14 02 

II I I I II I I II I I I I II II I I I I I I I I I I I I I I I II I I I II 

Db 956 AAAAGTGGCATGCAGATTGCTTTAAATGATCACCTAAAGCAGAGACGGGAAGTGGCCAAA 1015 

Qy 1403 ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGT 14 62 

II M I I I I I I I I I I I I I I II I I II M II I I I I II I I I I I I I I 
Db 1016 ACCGTCTTTTGCCTGGTCCTTGTCTTTGCCCTCTGCTGGCTTCCCCTTCACCTCAGCAGG 107 5 

Qy 1463 ATATTGAAGAAAACTGTGTATAACGAAATGGACAAG7VACCGATGTGAATTACTTAGTTTC 1522 

M I II I I I I I I M I I I II II II I I I I M I I I I I I I I 

Db 1076 ATTCTGAAGCTCACTCTTTATAATCAGAATGATCCCAATAGATGTGAACTTTTGAGCTTT 1135 

Qy 1523 TTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCC 1582 

I II I M I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I 
Db 1136 CTGTTGGTATTGGACTATATTGGTATCAACATGGCTTCACTGAATTCCTGCATTT^CCCA 1195 

Qy 1583 ATAGCTCTGTATTTTGTGAGCAAGAAATTTATKAAATTGTTTCCAGTCATGCCTCTGCTGC 1642 

II M M I I I I I I I I I I I I I II I III I I II I II II I I I II I I I I I I I I I I 
Db 1196 ATTGCTCTGTATTTGGTGAGCAAAAGATTCAAAAACTGCTTTAAGTCATGCTTATGCTGC 1255 

Qy 1643 TGCTG 1647 

I I I I 

Db 1256 TGGTG 1260 



RESULT 15 
US-10-311-671-28 

Sequence 28, Application US/10311671 
Publication No. US20040072996A1 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICT^NT 
APPLICTU^T 
APPLICANT 
APPLICANT 
APPLICANT 
APPLIC7\NT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICTU^T 
APPLICANT 
APPLICANT 



INCYTE GENOMICS, INC. 
LAL, Preeti G. 
BAUGHN, Mariah R. 
HAFALIA, April J. A. 
NGUYEN, Danniel B. 
GANDHI, Ameena R. 
KALLICK, Deborah A. 
GRIFFIN, Jennifer A. 
YUE, Henry 
KHAN, Farrah A. 
ARVIZU, Chandra S. 
LU, Dyung Aina M. 
TRIBOULEY, Catherine M. 
LU, Yan 

CHAWLA, Narinder K. 
GRAUL, Richard 
YAO, Monique G. 
YANG, Junming 
RAMKUMAR , Ja y a 1 a xmi 
AU-YOUNG, Janice K. 
ELLIOTT, Vicki S. 
HERNANDEZ, Roberto 
WALSH, Roderick T. 
BOROWSKY, Mark L, 
THORNTON, Michael B. 



APPLICANT: HE, Ann 

TITLE OF INVENTION: G-PROTEIN COUPLED RECEPTORS 
FILE REFERENCE: PI-0131 USN 

CURRENT APPLICATION NUMBER: US/10/311,671 
CURRENT FILING DATE: 2002-12-16 
PRIOR APPLICATION NUMBER: PCT/USOl/ 19275 
PRIOR FILING DATE: 2001-06-15 
PRIOR APPLICATION NUMBER: 60/212,483 
PRIOR FILING DATE: 2000-06-16 
PRIOR APPLICATION NUMBER: 60/213,954 
PRIOR FILING DATE: 2000-06-22 
PRIOR APPLICATION NUMBER: 60/215,209 
PRIOR FILING DATE: 2000-06-29 
PRIOR APPLICATION NUMBER: 60/216,595 
PRIOR FILING DATE: 2000-07-07 
PRIOR APPLICATION NUMBER: 60/218,936 
PRIOR FILING DATE: 2000-07-14 
PRIOR APPLICATION NUMBER: 60/219,154 
PRIOR FILING DATE: 2000-07-19 
PRIOR APPLICATION NUMBER: 60/220,141 
PRIOR FILING DATE: 2000-07-21 
NUMBER OF SEQ ID NOS : 35 
SOFTWARE: PERL Program 
SEQ ID NO 2 8 
LENGTH: 1632 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: mis cofeature 

OTHER INFORMATION: Incyte ID No: 6792419CB1 
US-10-311-671-28 

Query Match 9.6%; Score 395.8; DB 12; Length 1632; 

Best Local Similarity 65.7%; Pred. No. 2.9e-88; 

Matches 634; Conservative 0; Mismatches 307; Indels 24; Gaps 3; 

Qy 68 9 TGCCCACAGCAGACT7WUVTTACTTCAGCTTTCAAATACATTAACACTGTGATATCTTGT 74 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 555 TGCCAAGGACCCATCGAGATCAAGGAGACTTTCAAATACATCAACACGGTTGTGTCCTGC 614 

Qy 74 9 ACTATTTTCATCGTGGGAATGGTGGGGAATGCAACTCTGCTCAGGATCATTTACCAGAAC 808 

I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 615 CTTGTGTTCGTGCTGGGGATCATCGGGAACTCCACACTTCTGAGAATTATCTACAAGAAC 674 

Qy 809 AAATGTATGAGGAATGGCCCCAACGCGCTGATAGCCAGTCTTGCCCTTGGAGACCTTATC 8 68 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 675 AAGTGCATGCGAAACGGTCCCAATATCTTGATCGCCAGCTTGGCTCTGGGAGACCTGCTG 734 

Qy 869 TATGTGGTCATTGATCTCCCTATCAATGTATTTAAGCTGCTGGCTGGGCGCTGGCCTTTT 928 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 735 CACATCGTCATTGACATCCCTATCAATGTCTACAAGCTGCTGGCAGAGGACTGGCC 790 

Qy 92 9 GATCACAATGACTTTGGCGTATTTCTTTGCT^GCTGTTCCCCTTTTTGCAGAAGTCCTCG 988 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 791 ATTTGGAGCTGAGATGTGTAAGCTGGTGCCTTTCATACAGAAAGCCTCC 839 



Qy 



98 9 GTGGGGATCACCGTCCTCAACCTCTGCGCTCTTAGTGTTGACAGGTACAGAGCAGTTGCC 1048 



I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 84 0 GTGGGAATCACTGTGCTGAGTCTATGTGCTCTGAGTATTGACAGATATCGAGCTGTTGCT 8 99 

Qy 1049 TCCTGGAGTCGTGTTCAGGGAATTGGGATTCCTTTGGTAACTGCCATTGAAATTGTCTCC 1108 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 900 TCTTGGAGTAGAATTA7\AGGAATTGGGGTTCCAAAATGGACAGCAGTAGA7VATTGTTTTG 959 

Qy 1109 ATCTGGATCCTGTCCTTTATCCTGGCCATTCCTGAAGCGATTGGCTTCGTCATGGTACCC 1168 

I I I I I I III I I I I I I I I I I I I I I I I I I I I II I II I I 

Db 960 ATTTGGGTGGTCTCTGTGGTTCTGGCTGTCCCTGAAGCCATAGGTTTTGATATAATTACG 1019 

Qy 1169 TTTGAATATAGGGGTGAACAGCATAAAACCTGTATGCTCAATGCC ACATCAAAA 1222 

I I I M I M II I I II I I I II II II I M 

Db 1020 ATGGACTAC7W\.GGAAGTTATCTGCGAATCTGCTTGCTTCATCCCGTTCAGAAGACAGCT 107 9 

Qy 1223 TTCATGGAGTTCTACCAAGATGTAAAGGACTGGTGGCTCTTCGGGTTCTATTTCTGTATG 1282 

I I I I II I I I I I II I I I I I II II II I I I I I II I I I I I I I II I I I II 

Db 108 0 TTCATGCAGTTTTACAAGACAGCAAAAGATTGGTGGCTGTTCAGTTTCTATTTCTGCTTG 1139 

Qy 1283 CCCTTGGTGTGCACTGCGATCTTCTACACCCTCATGACTTGTGAGATGTTGAACAGAAGG 1342 

I I I II I I I I II I I I I II I I I I I I I I I I M I I I I I I I I I I I I I 

Db 114 0 CCATTGGCCATCACTGCATTTTTTTATACACTAATGACCTGTGAAATGTTG AGAAAG 1196 

Qy 1343 AATGGCAGCTTGAGT^TTGCCCTCAGTGAACATCTTAAGCAGCGTCGAGAAGTGGCAAAA 1402 

II I II II I I II I I I I I I I I I I I I I I II I I I I I I I I I II II I 

Db 1197 AAAAGTGGCATGCAGATTGCTTTAAATGATCACCTAAAGCAGAGACGGGAAGTGGCCAAA 1256 

Qy 1403 ACAGTTTTCTGCTTGGTTGTAATTTTTGCTCTTTGCTGGTTCCCTCTTCACTTAAGCCGT 14 62 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I II I 

Db 1257 ACCGTCTTTTGCCTGGTCCTTGTCTTTGCCCTCTGCTGGCTTCCCCTTCACCTCAGCAGG 1316 

Qy 1463 ATATTGAAGAAAACTGTGTATAACGAAATGGACAAGAACCGATGTGT^TTACTTAGTTTC 1522 

II I I I II I I I I II I I I II II M I I I I I I I I I I I I I I 

Db 1317 ATTCTGAAGCTCACTCTTTATAATCAGAATGATCCCAATAGATGTGAACTTTTGAGCTTT 1376 

Qy 1523 TTACTGCTCATGGATTACATCGGTATTAACTTGGCAACCATGAATTCATGTATAAACCCC 15 82 

I III I I I I II I I II II I I I I I II I I I I I I I I I I I i I II I I I 

Db 1377 CTGTTGGTATTGGACTATATTGGTATCAACATGGCTTCACTGAATTCCTGCATTAACCCA 1436 

Qy 1583 ATAGCTCTGTATTTTGTGAGCAAGAAATTTAAAAATTGTTTCCAGTCATGCCTCTGCTGC 1642 

II I I I I I I I I I I I I I I I I I II I III I I I I I M II I I I I I I I I I I I I I I I 
Db 1437 ATTGCTCTGTATTTGGTGAGCAAAAGATTCAAAAACTGCTTTAAGTCATGCTTATGCTGC 14 9 6 

Qy 1643 TGCTG 1647 

I I I I 

Db 1497 TGGTG 1501 



Search completed: May 15, 2004, 00:12:28 
Job time : 1572.76 sees 



